Entretien avec Mokrane Bouzeghoub, directeur scientifique adjoint de l’Institut des sciences de l’information et de leurs interactions (INS2I) du Centre national de la recherche scientifique (CNRS), sur le big data et la science des données.
Pouvez-vous définir le big data ?
On utilise souvent les termes big data et sciences des données de façon interchangeable. Pour les distinguer, le big data est l’ensemble des données destinées à un traitement de masse alors que la science des données est l’ensemble des techniques mises en œuvre pour gérer ces données. Le big data est un domaine extrêmement vaste au carrefour de nombreuses disciplines : informatique, intelligence artificielle, réseaux de communication, sciences de l’information… Il s’est développé grâce à la puissance de calcul des nouveaux ordinateurs et à la capacité de stockage actuelle, les outils ont atteint un niveau de maturité qui permet d’adresser des volumes de données inimaginables. La production massive de ces données à travers Internet et les réseaux sociaux, sans oublier les capteurs dont sont truffées les villes et même les maisons, fait qu’on se retrouve avec un flux d’informations considérable qu’il faut traiter, souvent en temps réel. Tout cela permet de rendre visible ce qui ne l’était pas avant.
Qui cela concerne-t-il ?
Tout le monde est concerné, mais pas à la même échelle ni avec les mêmes objectifs. Commerçants, industriels, décideurs, médecins, scientifiques… Mais aussi tous les citoyens. Les données interviennent dans la vie quotidienne. Lorsque vous effectuez une recherche sur Internet, les résultats ne sont pertinents que parce que Google a amassé une quantité considérable d’informations sur les navigations des uns et des autres. Vous êtes donc à la fois bénéficiaire et contributeur, mais en même temps, cela amène un questionnement sur votre vie privée. Vous payez le bénéfice avec cet effet indésirable. Cela peut conduire à une position défensive si l’on considère que c’est trop envahissant, ce qui mène directement à des interrogations sur le consentement de la collecte de données et au Règlement général sur la protection des données (RGPD). Ou cela peut être considéré comme une opportunité, un canal de création, de richesse et de nouveaux business.
Quels en sont les enjeux ?
Tant que les données étaient des trésors détenus par certains seulement, le pouvoir était entre leurs mains. A présent qu’elles sont à la portée de tout le monde, cela a changé notre comportement : notre façon de nous déplacer, d’acheter, de nous cultiver, de consommer, et même nos rapports entre humains. Cela crée à la fois de nouvelles structures de la société et de nouveaux modes de gouvernance, mais aussi de nouvelles inquiétudes et risques. On peut établir un parallèle avec la prolifération d’autres ressources. Dans l’Histoire, lorsque nous sommes passés à l’ère industrielle, cela a eu un très fort impact sur la société en modifiant son fonctionnement. Il y a eu du positif et du négatif. C’est également le cas avec les données.