“Big data et Big Brother, c’est vieux comme le monde”. Le forum annuel organisé à la Maison de la chimie à Paris par l’un des fleurons de l’innovation israélienne, le Technion, abordait lundi 15 décembre les enjeux du big data.
Par Yoann Duval (Copyrights Le Point)
Le big data. Tel était le thème cette année du colloque organisé par l’association du Technion France, en partenariat avec Le Point. Comment collecter cette nouvelle masse d’information ? Comment exploiter et traiter ces données pour une meilleure compétitivité d’entreprise ? Comment se protéger ? Tout au long de la journée de lundi, les 28 experts réunis à la Maison de la chimie à Paris, ont échangé sur le sujet.
Parmi eux : Geneviève Fioraso, secrétaire d’État à l’Enseignement supérieur et à la Recherche ; Axelle Lemaire, secrétaire d’État chargée du Numérique ; Jean-Luc Beylat, président d’Alcatel Lucent Bell Labs France et du pôle de compétitivité Systematic Paris-région ; Pascal Colombani, président du conseil d’administration Valeo ; Cédric Villani, mathématicien, professeur & médaille Fields 2010 ; Yannick Bolloré, P-DG du groupe Havas ; Gilles Babinet, président de Captain Dash, champion du numérique pour la France & Commission européenne ; Henry Verdier, directeur d’Etalab, entre autres…
Revivez le direct de cet échange.
17 h 40
Didier Renard (CloudWatt) : “La question de l’appropriation des données, c’est avant tout une question de souveraineté nationale !”
François Soulie-Fougelman (TeraLab) : “Sommes-nous capables de créer des tiers de confiance qui s’interposent entre nous et ceux qui collectent les données ? Aujourd’hui, il n’y pas de choix ! Il faut également demander à ces tiers d’être souverain. Car pour que la Cnil puisse les contrôler, il est nécessaire qu’ils soient en France.”
17 h 18
Alain Bensoussans (avocat) : “Chacun doit se battre pour un droit à la propriété universelle ! Je ne crois pas à une Europe où la vie privée serait dépassée. Je crois plutôt à celui de la propriété, de la révélation et du droit à l’intimité numérique.”
Francis Jutand (Mines-Telecom) : “Il ne faut pas confondre les données et le big data. Le big data apporte de l’éclairage aux données.”
16 h 55
Éric Perez (Cnil) : « Si le contrat entre l’utilisateur et la marque est clair, on restaurera la confiance. Pourtant, on remarque que les données sont collectées de façon massive et illicite. C’est cela qui pose problème. Si on veut aller vers cette innovation, encore faut-il qu’on redonne du sens et de l’éthique !
La Cnil ne fait que sanctionner. Soyons clairs…il n’y a pas de liberté sans état de droit. Ces libertés, c’est la vie privée, ma façon de me déplacer… Ce n’est pas le big data qui est dangereux, c’est son utilisation. Nous avons des politiques qui ne sont pas à la hauteur et particulièrement sur le règlement européen sur la protection des données ! Big data et Big Brother, c’est vieux comme le monde. Durkheim faisait déjà du big data. »
16 h 25
Francis Jutand (Mines-Telecom) : “S’agissant de la question fondamentale de la vie privée, il est nécessaire de mettre autour de la table toutes les disciplines du savoir. Car, nous assistons à une co-évolution profonde entre l’être humain et tous les outils du numérique, incluant les données. Il ne faut pas le rejeter par principe, mais permettre à ce continent de numérique d’explorer et de donner toutes ces richesses.”
16 h 20
Bernard Ourghanlian (Microsoft) : “Les données posent bien évidemment des questions éthiques. Peut-on s’autoriser à collecter les données ? À quelles finalités sont soumises cette collecte ? Il est d’ailleurs parfois difficile de les définir. Par exemple, si nous étions sûrs de guérir le cancer du foie, que ferions-nous ? Finalement, tout ça échappe encore à la loi Éthique et Liberté.”
16 h 15. Place à la quatrième et dernière table ronde : Protection de la vie privée et gestion des données personnelles. Avec Koky Crammer, professeur au Technion ; Francis Jutand, directeur scientifique à l’institut des Mines-Telecom ; Alain Bensoussan, Avocat ; Bernard Ourghanlian, directeur de la Technologie et de la Sécurité chez Microsoft ; François Soulie-Fogelman, directrice scientifique à l’Institut Mines Telecom – TeraLab ; Jakob Haesler, co-fondateur tinyclues et Eric Peres, vice-président de la Cnil.
15 h 35
À la question du public : “Les résultats d’un modèle dépendent à la fois du volume de données et de l’algorithme lui-même. Quel est le plus important : la course aux données ou une course au logiciel ?”
Florian Douetteau (Dataïku) répond qu’il “y aura évidemment une course à la donnée, surtout en ce qui concerne la capacité à la capter et à la mobiliser (particulièrement dans le domaine de la santé. Ce ne sera pas la quantité pure mais davantage une prime au nombre de personnes différentes. Sur les cinq années suivantes, on reviendra à l’algorithme.”
Michel Benard (Google) : “D’un point vue purement économique, les algorithmes rentrent relativement rapidement dans le domaine public alors que les données, elles, restent confidentielles. C’est un avantage comparatif !”
15 h 15
Michèle Sebag (directrice de recherche au CNRS) : « Nous sommes de plus en plus soumis au storytelling. On part d’un exemple pour s’identifier à une situation ; vous achetez l’expérience particulière. Avoir le sens des données, c’est pouvoir atteindre le général. Passer du “il existe”, à “la moyenne”.
Florian Douetteau (cofondateur de Dataiku) : “Il faut s’assurer que l’éducation soit en adéquation avec la société. Avant, on pouvait faire des études longues sans appréhender ni la probabilité, ni les statistiques. Aujourd’hui ce n’est plus possible ! Le corpus de base de nos étudiants se doit d’être plus riche. On ne peut plus faire l’impasse sur les mathématiques.”
14 h 45
Avigdor Gal, professeur au Technion : “Les mathématique et les statistiques sont la base de la formation pour nos futurs ingénieurs. Ce qui doit faire le lien, c’est la joie de vouloir mettre son nez dans les données. Il faut surtout comprendre la dynamique qui se trouve derrière les données : on peut apporter des réponses très rapides à des problèmes scientifiques complexes. Après, on ne peut plus s’en passer !”
Serge Abiteboul (l’Inria) : “Tout explose. Il faut casser la montagne qui sépare les humanités de la science. Ne parle-t-on pas de digital humanities ? On peut faire de l’analyse de données dans les textes contes de fées. Il faut permettre aux enfants de toucher à tout pour faire le bon choix et surtout… se faire plaisir !”
14 h 25
Stéphane Mallat (mathématicien) : “Les mathématiques deviennent de plus en plus fondamentales ; elles accélèrent les phases d’expérimentation pour trouver des produits de plus en plus efficaces. Mais, aujourd’hui, les étudiants partent dans des grands groupes américains, car les offres sont plus attractives. Il manque des gens qui puissent utiliser les mathématiques, informatique et avoir le pied dans les données. Tout le monde est conscient du problème.”
Stéphan Clemençon (Télécom ParisTech) : “Beaucoup de problèmes mathématiques sont posés par les nouvelles technologies et particulièrement la donnée. On parle ici de choses très concrètes. Le big data, c’est beaucoup de buzz et de promesses, mais c’est aussi des challenges scientifiques très concrets : le temps réel, la vélocité de calcul, l’utilisation des données de Twitter…”
14 h 15. Rendez-vous pour la troisième table ronde : “Data science : recherche, éducation et formation aux big data”. Avec Cédric Villani, mathématicien ; Avigdor Gal, professeur au Technion ; Serge Abiteboul, directeur de la recherche de l’Inria ; Michel Benard, directeur des relations académiques de Google ; Florian Douetteau, cofondateur de Dataiku ; Stéphan Clemençon, professeur à Télécom ParisTech ; Michèle Sebag, directeur de recherche CNRS/Inria ; Stéphane Mallat, mathématicien.
12 h 58
Mohammad Afshar (Ariana Pharmaceuticals): « En santé, le plus compliqué, c’est d’interpréter la donnée récoltée. On a besoin d’outils pour regarder les combinaisons. Un nouveau business émerge car le rôle de la partie logiciel devient de plus en plus important. C’est une véritable révolution. Par exemple, dans le cas des cancers du cerveau, il est aujourd’hui possible, grâce à l’analyse d’algorithmes, de diagnostiquer en temps réel si le chirurgien est bien dans la tumeur ou non.
Google et Amazon s’intéressent aujourd’hui à cette révolution dans l’industrie pharmaceutique et celle du diagnostic. Ce n’est pas anodin. »
12 h 43
Shai Shen-Orr (professeur au Technion) : “La santé doit s’adapter au big data. Pour récolter de la donnée, il faut la standardiser ; ce n’est pas le cas ! Par ailleurs, je récolte tellement de données que je ne peux pas tout comprendre, car l’état de la recherche ne me le permet pas encore. Peut-être ai-je récolté de l’or ? Il s’agit d’une récolte d’information prédictive.”
12 h 20
Ronan Stephan (Alstom) : “On voit poindre de nouveaux arrivants sur nos marchés. Il y a 18 mois, des groupes majeurs de la Silicon Valley ont acheté des centrales électriques avec pour objectif d’éviter les black-out du fait de leurs serveurs énergivores. Ces groupes s’intéressent à l’observation d’un système pour en déduire une fonction de contrôle. Il s’agit de fournir des systèmes globaux pour prendre des décisions fines, on parle de calcul intensif. Le big data, c’est un mouvement du soft vers le hard. Ce qui crée de la valeur ici, c’est encore la donnée. Dans les transports, l’enjeu, c’est la maintenance prédictive : récolter davantage de données pour prévenir les anomalies. Très vite se posera la question du partage de la donnée avec les usagers (et donc la monétisation de ce partage).”
12 h 10
Jean-François Minster (Total) : “On comptabilise cent millions de transactions financières par an. Chacun veut des services quand il achète, connecter les stations d’essence avec le Wi-Fi, par exemple. En Afrique, nous avons 5 000 stations-service dans des endroits où il n’y a ni banque ni carte de crédit, mais 800 millions de portables ! Il faut leur permettre de gérer la transaction grâce à leur téléphone. On a fait des partenariats avec des banques pour faciliter ce paiement. On a créé un modèle d’affaires totalement nouveau. Le big data, ce n’est pas du futur, c’est aujourd’hui ! Loin des stéréotypes, le big data ce n’est pas un métier d’informaticien, il faut penser business”, conclut-il
11 h 40
Patrick Bensabat ( Business & Decision) : “La technologie évolue très rapidement, on doit faire face à cet enjeu. Il y a un deuxième enjeu, celui de la donnée (compréhension, structuration, exploitation et analyse …). Et, pour finir, celui des usages. On accompagne certains États, sur la fraude (comme l’État belge). On a travaillé sur des données libres pour les confronter avec des données sur les déclarations. On a ainsi réduit de 95 % la fraude sur les carrousels de TVA. Le big data ne remplace pas l’humain. On apporte des suggestions à une prise de décision.”
Nathalie Boulanger (Orange Start-up Ecosystème) : “On ne commercialise aucune donnée personnelle !”
11 h 26
Nathalie Boulanger : “On est dans une rupture technologique. On prévoit que d’ici 2020, 1/3 des données seront dans le cloud à des prix de plus en plus bas. Le génome humain, par exemple, on peut le lire pour 1 000 dollars, il y a dix ans, cela coûtait à 1 million de dollars.”
Chaque minute, 100 000 tweets sont échangés. Puis, arrivent les objets connectés, avec une estimation pour 2050 de 50 milliards d’objets connectés dans le monde. Le monde devient données. “Le big data va créer 8 % du PIB, en valeur supplémentaire : pour 1/3 du chiffre d’affaires mais surtout 2/3 d’économies !” s’enthousiasme Nathalie Boulanger.
Pascal Colombani, président du conseil d’administration de Valeo et modérateur : « Le big data apporte une assise statistique qui développera des connaissances qui sont aujourd’hui en gisement. J’espère que cela amènera de la croissance, de l’emploi et du développement technologique. »
11 heures. Lancement de la seconde table ronde : “Stratégie open data des entreprises et data intelligence, exploitation et traitement des données”. Avec Shai Shen-Orr, professeur au Technion ; Jean-François Minster, directeur scientifique de Total ; Nathalie Boulanger, directrice du programme Orange Start-up Ecosystème ; Ronan Stephan, directeur innovation du groupe Alstom ; Mohammad Afshar, PDG Ariana Pharmaceuticals ; Patrick Bensabat, fondateur de Business & Decision ; Henri Verdier, directeur Etatlab.
10 h 50
Maya Said : » L’industrie pharmaceutique était très loin du patient. Aujourd’hui, tout est bouleversé. Le patient lui-même prend en charge ces problématiques via des compagnies spécialisées. Il s’agit d’intégrer le parcours du malade à nos stratégies d’entreprise. »
À la question du public “Qui nous garantit la sécurité de nos données ?” :
Yannick Bolloré : “Les mails, posts sur Facebook sont analysés. Les paroles volent et les écrits restent. Il faut être attentif.”
Gilles Babinet : “Le principe de précaution ne doit pas être la philosophie de base. À la fin des années 1990, il y avait une réflexion sur le spamming. Les États-Unis aujourd’hui sont l’endroit où la politique de gestion des campagnes d’e-mails est la plus efficace. Je ne crois pas fondamentalement au contrat. Mais que les acteurs intéressés fassent évaluer la norme pour trouver un compromis acceptable est la seule solution. Si la pseudonymisation des données ne peut pas être absolument dépassée, je pense qu’on aura beaucoup deproblèmes.”
10 h 45
Peretz Lavie : “En Israël, l’entrepreneuriat est dans notre ADN. Depuis vingt-six ans, le Prix Nobel Dan Shechtman donne un cours d’entrepreneuriat…”
10 h 42
Gilles Babinet : “Chaque révolution industrielle amène son lot de droit. À Bruxelles, on discute depuis quatre ans sur le règlement européen des données. C’est de très loin le texte sur lequel les lobbys sont le plus actifs. Ce texte va sûrement réguler les cent prochaines années. C’est un texte fondamental ! En France, on est en train de rater cette révolution conceptuelle du droit. Soit on change, soit on va se faire effacer de l’histoire. Il faut ciseler le droit pour permettre l’innovation et protéger les individus.”
10 h 30
François Bourdoncle : “La révolution numérique, c’est d’abord une révolution d’usage. Le big data est une opportunité si les entreprises le comprennent. On est dans une économie de leader naturel, quasi monopolistique. Regardez Google ou Amazon ! Quand Google lance Google+ en réaction à Facebook, cela ne fonctionne pas. Dans cette économie, il n’y a pas de place pour des numéros deux.”
10 h 25
Kira Radinsky : “On a beaucoup de choses à gagner à perdre une partie de nos vies privées. On pourrait, par exemple, récupérer les données de tous les hôpitaux pour les utiliser. Il s’agirait d’une révolution médicale.”
10 h 15
Le professeur Peretz Lavie : “Les universités doivent s’adapter au big data, car c’est une réalité impérieuse. Bien sûr en l’apprenant à nos étudiants mais aussi en éduquant nos experts, les fameux data scientists, ce nouveau métier d’avenir. Et les universités s’y mettent aussi : avec les MOOCs – ces cours en ligne lancés par Stanford -, l’éducation devient globale.”
En 2011, le Technion a lancé avec l’université de Cornell un campus technologique à New York. “Il s’agit d’un campus partagé où trois hubs sur le big data seront à la pointe de l’innovation”, rappelle le professeur Peretz Lavie.
10 h 10
Yannick Bolloré : “Les mégadonnées ouvrent un nouveau monde pour parler à ses clients et ses prospects. En monitorant le comportement des uns et des autres, on est capable de proposer à un consommateur un message personnalisé au meilleur moment de la journée et sur le meilleur support. C’est une révolution ! La publicité devient moins intrusive et les marques peuvent mesurer l’impact de chaque média sur les ventes de leurs produits.”
10 heures
Maya Said : “Avec l’arrivée des données dans l’industrie pharmaceutique, l’évolution la plus marquante tient au fait qu’on est passé d’un monde où la génération des données était la source de l’avantage comparatif à un monde où il faut les comprendre et les exploiter. Comment faire sens avec ces données ?”
9 h 55
Gilles Babinet, à propos de la révolution big data : “Si elle est une révolution technologique, c’est avant tout une révolution anthropologique.” Une révolution qui exige de “repenser totalement sa relation avec ses clients”. Gilles Babinet, toujours, cite Éric Carreel, le fondateur de Withings : “Si vous êtes un fabricant de matelas, la révolution, ce n’est plus de vendre de bons ressorts mais bien de vendre du sommeil.”
9 heures. Lancement de la première table ronde : “Le tsunami numérique pour une nouvelle ère d’innovation”.
Avec Kira Radinsky, cofondatrice de SalesPredict ; François Bourdoncle, cofondateur de FB&Cie ; Patrice Fonlladosa, P-DG de Veolia, Afrique-Moyen-Orient ; Gilles Babinet, Champion du numérique pour la France à la Commission européenne ; Yannick Bolloré, P-DG du groupe Havas ; Peretz Lavie, président du Technion ; Maya Said, vice-présidente pour la stratégie scientifique et innovation de Sanofi.
Source: Le Point (Copyrights).