Weizmann (Israël) : solutions convergentes, les réseaux artificiels font la lumière sur la reconnaissance faciale

[:fr]

Notre cerveau est tellement prêt à reconnaître les visages – ou à distinguer les personnes – que nous nous arrêtons rarement  pour y penser, mais ce qu’il se passe dans le cerveau lorsqu’il est impliqué dans une telle reconnaissance échappe encore à notre compréhension. Des chercheurs de l’Institut scientifique Weizmann ont jeté un nouvel éclairage sur ce problème. Ils ont découvert une similitude frappante entre la manière dont les visages sont codés dans le cerveau et la réussite des systèmes d’intelligence artificielle appelés réseaux de neurones profonds.

Lorsque nous regardons un visage, des groupes de neurones du cortex visuel sont activés et déclenchent leurs signaux. En fait, certains groupes de neurones répondent sélectivement aux visages mais pas aux autres objets. Mais comment l’activation de neurones individuels se combine-t-elle pour produire la perception et la reconnaissance du visage ?

Le Pr Rafi Malach, du département de Neurobiologie, et Shany Grossman, étudiante en doctorat de son groupe, ont eu l’idée de répondre à cette question en comparant l’activité du cerveau humain à des réseaux de neurones profonds. Ces systèmes informatiques, qui ont récemment révolutionné le domaine de l’intelligence artificielle, sont formés pour effectuer des tâches par l’apprentissage d’énormes ensembles de données. Au cours des dernières années, ils se sont tellement améliorés qu’ils se comportent maintenant aussi bien que les humains, voire mieux, dans diverses tâches visuelles, notamment la reconnaissance faciale.

Grossman et Guy Gaziv, étudiants au Département d’informatique et de mathématiques appliquées, ont analysé les données obtenues auprès de 33 personnes dans le laboratoire du Dr Ashesh Mehta de l’Institut Feinstein de recherche médicale à Manhasset, New York. Ce groupe unique de sujets est constitué de patients atteints d’épilepsie à qui des électrodes ont été implantées dans diverses régions du cerveau à des fins de diagnostic et qui se sont portés volontaires pour participer à divers travaux de recherche.

Pendant que les volontaires se voyaient présenter une série de visages provenant de différentes bases de données d’images, y compris des individus célèbres et d’autres inconnus, leur activité cérébrale était surveillée via des enregistrements issus de 96 électrodes implantées dans la partie du cerveau responsable de la perception des visages. Les enregistrements ont indiqué que chaque visage évoquait un modèle unique d’activation neuronale, impliquant différents groupes de neurones qui s’activaient à différentes intensités. Il est intéressant de noter que certaines paires de visages ont provoqué des schémas d’activité cérébrale similaires, c’est-à-dire qu’ils avaient des « signatures » d’activité similaires, alors que d’autres ont induit des schémas d’activation très différents les uns des autres. Les chercheurs étaient curieux de savoir si ces signatures d’activation jouent un rôle important dans notre capacité à reconnaître les visages.

Ils ont décidé de comparer le système de reconnaissance du visage humain à celui d’un réseau de neurones profonds ayant une capacité de reconnaissance faciale similaire. Ce réseau artificiel, vaguement inspiré par le système visuel humain, contient des éléments artificiels, analogues à des neurones, disposés en une vingtaine de « couches ». Pour reconnaître le visage d’une personne, les neurones artificiels de chaque couche sélectionnent et combinent différents traits du visage –  des plus simples, comme les lignes et les formes primitives, jusqu’aux formes plus complexes, telles que des parties de l’œil et d’autres parties du visage, et des formes définitives comme l’identité d’une personne.

Les chercheurs ont estimé que si les schémas de codage des visages trouvés dans le cerveau humain étaient essentiels pour permettre aux humains de reconnaître les visages, ces signatures devaient également se trouver dans le réseau artificiel. Pour vérifier si c’était le cas, ils ont présenté au réseau les mêmes images de visages montrées aux volontaires humains. Ils ont ensuite vérifié si ces visages suscitaient des ensembles de modèles d’activation exclusifs, présentant la même diversité et la même structure que ceux détectés dans le cerveau humain.

Curieusement, les scientifiques ont trouvé un parallèle frappant entre les systèmes humain et artificiel. C’était surtout dans les couches moyennes du réseau profond – celles qui représentent l’apparence picturale réelle des visages plutôt que l’identité personnelle plus abstraite des propriétaires de visages.

« Il est très instructif de constater que deux systèmes aussi différents, un biologique et un artificiel, à savoir le cerveau et un réseau neuronal profond, ont évolué de telle manière qu’ils possèdent des caractéristiques similaires », déclare Malach. « Je nommerais cette évolution comme convergente – tout comme les avions fabriqués par l’homme présentent des similitudes avec ceux des ailes d’insectes, d’oiseaux et même de mammifères. Une telle convergence souligne l’importance cruciale des modèles uniques de codage de visage dans la reconnaissance faciale ».

« Nos résultats corroborent l’hypothèse selon laquelle les schémas d’activation distincts des neurones en réponse à différents visages, ainsi que la relation entre ces schémas, jouent un rôle clé dans la façon dont le cerveau perçoit les visages », déclare Grossman. « Ces résultats peuvent nous aider à mieux comprendre comment la perception et la reconnaissance faciale sont codées dans le cerveau humain. D’autre part, ils peuvent également contribuer à améliorer encore les performances des réseaux de neurones en les ajustant de manière à les rapprocher des schémas de réponse cérébrale observés. « 

Les auteurs de l’étude comprenaient également Michal Harel du Département de Neurobiologie, le Professeur Michal Irani du Département d’Informatique et de Mathématiques appliquées et le groupe du Dr Mehta de l’Institut Feinstein de recherche médicale.

Publication dans Nature Communications

[:]