La data science (science des données) consiste à tirer des informations utiles de grandes quantités de données, en combinant statistiques, informatique et connaissance métier. Son but : transformer des données brutes en décisions. Voici ce que c'est, à quoi ça sert, et ce que ça change pour une PME, même sans recruter d'expert.
La data science, c'est quoi ?
La data science est la discipline qui consiste à extraire du sens et des prédictions à partir de données, en mêlant trois savoir-faire : les statistiques, la programmation et la connaissance d'un métier. Elle répond à des questions que l'on ne pourrait pas trancher à l'œil nu.
Là où un simple rapport décrit ce qui s'est passé, la data science cherche à comprendre pourquoi, et à anticiper ce qui va arriver. Elle repère des tendances cachées dans des volumes que personne ne pourrait lire à la main.
En clair, c'est l'art de faire parler les données pour mieux décider, plutôt que de se fier à l'intuition seule.
Que fait un data scientist ?
Un data scientist collecte des données, les nettoie, construit des modèles pour y trouver des schémas, puis traduit les résultats en recommandations concrètes. Il fait le lien entre la donnée brute et la décision métier.
Le métier a connu un engouement spectaculaire dans les années 2010, au point que la Harvard Business Review qualifiait dès 2012 le data scientist de « métier le plus sexy du XXIe siècle » (Harvard Business Review).
Dans les faits, le quotidien est moins glamour qu'on l'imagine. Selon une enquête CrowdFlower relayée par Forbes, près de 80 % du temps d'un analyste part dans la collecte et la préparation de la donnée, avant même la moindre analyse (Forbes). C'est dire si la qualité des données compte plus que les algorithmes.
Pourquoi la data science intéresse une PME
Parce qu'elle répond à des questions très concrètes : quels clients risquent de partir, quels produits pèsent sur la marge, quand faut-il réapprovisionner. Des réponses qui valent de l'argent, et qui restent souvent enfouies dans les fichiers de l'entreprise.
Beaucoup de dirigeants pensent que c'est réservé aux grands groupes. C'est une idée reçue. L'enjeu n'est pas la taille, mais l'accès à une donnée fiable et aux bons outils.
Un exemple. Chez une cartonnerie que nous accompagnons, le suivi de la donnée de production pilote aujourd'hui cinq tableaux de bord sur un socle unique, avec 1 875 ordres de fabrication suivis et les alertes de rupture remontées automatiquement. Aucun data scientist n'a été recruté pour cela.
Data science, data analyse, big data : quelle différence ?
La data analyse répond à des questions précises sur le passé (que s'est-il passé, et pourquoi). La data science va plus loin : elle modélise et prédit, en s'appuyant sur le machine learning. Le big data, lui, désigne simplement de très gros volumes de données.
Ces notions se recoupent largement. Pour une PME, la frontière a peu d'importance : ce qui compte, c'est de passer d'un classeur que personne ne lit à des réponses utiles pour décider.
Les étapes d'un projet de data science
Un projet de data science suit presque toujours le même fil.
- Poser la bonne question. Que cherche-t-on à améliorer : la marge, les stocks, la fidélité client ?
- Rassembler et préparer la donnée. L'étape la plus longue, et la plus déterminante pour la fiabilité du résultat.
- Modéliser. Chercher des schémas, tester des hypothèses, parfois entraîner un modèle de machine learning.
- Restituer. Traduire le résultat en tableau de bord ou en recommandation claire, compréhensible par un non-spécialiste.
Sans la deuxième étape, tout le reste s'effondre : un modèle nourri de données fausses produit des conclusions fausses.
Des exemples concrets en PME
La data science ne sert pas qu'aux géants du web. Quelques usages parlent à n'importe quelle PME.
- Prévoir la demande pour ajuster les stocks et éviter autant la rupture que le surstock.
- Repérer les clients à risque de départ, à partir de leur historique d'achat, pour les relancer à temps.
- Identifier les produits qui pèsent sur la marge, au-delà du seul chiffre d'affaires apparent.
- Optimiser les tournées ou la production en croisant plusieurs sources de données.
Le point commun de ces usages : transformer des données que vous possédez déjà en décisions qui rapportent, sans avoir à deviner.
La data science sans recruter de data scientist
Le profil de data scientist est rare et coûteux, hors de portée de la plupart des PME. La bonne nouvelle : vous pouvez accéder aux mêmes résultats sans en recruter un.
C'est l'approche de Clidd : des data analysts externalisés, outillés par l'IA, construisent et maintiennent vos flux de données pour vous. Vos données d'ERP sont réunies, fiabilisées et transformées en tableaux de bord à jour, sans équipe interne. Vous gardez la décision, nous prenons en charge la donnée. La première brique reste toujours la même : consolider vos données avant de les analyser. Vous bénéficiez ainsi de la puissance de la data science, à un coût de PME, sans en porter la complexité ni le recrutement.
Questions fréquentes
Quelle est la différence entre data science et data analyse ?
La data analyse répond à des questions sur le passé : que s'est-il passé, et pourquoi. La data science va plus loin en modélisant et en prédisant, souvent avec du machine learning. La frontière est poreuse, mais la data science est davantage tournée vers la prédiction.
Faut-il être mathématicien pour faire de la data science ?
Pour la pratiquer en profondeur, des bases solides en statistiques et en programmation aident. Mais pour en bénéficier dans une PME, non : des outils et des prestataires font ce travail à votre place.
Une PME a-t-elle besoin d'un data scientist ?
Rarement en interne. Le coût et la rareté du profil le réservent surtout aux grands groupes. Une PME peut accéder aux mêmes résultats via une plateforme et des analysts externalisés.
Quels outils utilise un data scientist ?
Le plus souvent des langages comme Python ou R, des bibliothèques de machine learning, et des outils de préparation et de visualisation des données.
Data science et intelligence artificielle, est-ce pareil ?
Non, mais elles se recoupent. La data science est la discipline qui exploite les données ; l'intelligence artificielle et le machine learning sont des outils qu'elle utilise pour prédire et automatiser.
Pour aller plus loin
Ressources complémentaires
- Harvard Business Review, « Data Scientist: The Sexiest Job of the 21st Century »
- Forbes, « Data Preparation: Most Time-Consuming, Least Enjoyable Data Science Task »


