Programme informatique est capable de reconstruire des langues éteintes

Les chercheurs de l'université de Berkeley ont développé un système capable de reconstruire les langues éteintes à partir desquelles les langues actuelles ont été développées. Cette «pierre de rosette» sous forme de logiciel est capable de reconstituer ce que l’on appelle des protolangages, travail actuellement effectué par des linguistes, processus connu pour être extrêmement lent et laborieux.

Dan Klein, l'un des coordinateurs de l'étude, déclare que le logiciel peut accélérer une étude qui prendrait des centaines d'années. "L'analyse humaine de toutes ces informations prend du temps. Il existe des milliers de langues, avec des milliers de mots et de variantes. Sans parler des langues qui les ont provoquées."

Pour l’enseignant, "il faudrait des centaines d’années pour analyser en profondeur toutes ces langues, pour recouper tous les changements survenus au fil du temps. C’est donc là que l’ordinateur montre tout son éclat", at-il ajouté.

Pour développer le système, l’équipe a utilisé 637 langues parlées actuellement en Asie et dans le Pacifique et a ainsi réussi à recréer la langue morte de leur naissance, appelée proto-austronésien. Avec une base de plus de 142 000 mots, le programme a pu recréer le langage primitif dont on estimait qu'il était parlé il y a environ 7 000 ans.

Le logiciel est basé sur la théorie linguistique la plus largement acceptée selon laquelle les mots évoluent comme des branches, semblables à un arbre généalogique, les racines étant les protolingues et quittant les langues modernes.

Le programme ordonne à des ensembles de mots apparentés - des mots similaires dans différentes langues ayant également des sons similaires - leur histoire et leur origine afin de calculer les probabilités que l'ensemble soit dérivé d'un protolingue. Pour cela, le système utilise un algorithme appelé «Monte Carlo dans les chaînes de Markov».