L'apprentissage automatique aide à la découverte de l'alphabet de la baleine cachalot

Les chercheurs du MIT CSAIL et du projet CETI estiment avoir débloqué une sorte d'alphabet de baleine cachalot grâce aux technologies d'apprentissage automatique. Les résultats de l'étude, publiée sous le titre « Structure contextuelle et combinatoire dans les vocalisations des cachalots », pointent vers des percées clés dans notre compréhension de la communication des cétacés.

L'étude porte sur les codas - une série de clics qui remplissent différentes fonctions linguistiques. « Ce que nous avons découvert, c'est qu'il existe une variation de la structure des codas jusqu'alors non décrite », a déclaré la directrice du CSAIL, Daniela Rus, à TechCrunch. « Nous avons découvert que les types de codas ne sont pas arbitraires, mais qu'ils forment plutôt un système de codage combinatoire nouvellement découvert. »

Alors que les vocalisations de baleines ont été un sujet de recherche clé depuis des décennies, les équipes derrière cette nouvelle recherche suggèrent avoir découvert un niveau de nuance jusqu'alors inconnu parmi les bavardes mammifères marins. Le document indique que des recherches antérieures ont noté 150 codas différents de baleines cachalots.

« Un sous-ensemble de ceux-ci a été montré pour coder des informations sur l'identité de l'appelant et du clan », explique-t-il. « Cependant, presque tout le reste du système de communication des baleines cachalots, y compris des questions fondamentales sur sa structure et sa capacité à porter des informations, reste inconnu. »

Les équipes se sont appuyées sur le travail de Roger Payne, le biologiste marin pionnier décédé en juin dernier. Le travail le plus influent de Payne concernait les chansons des baleines à bosse. « Il nous a vraiment inspirés à utiliser nos technologies les plus avancées pour avoir une compréhension plus profonde des baleines », déclare Rus.

Les équipes ont déployé des solutions d'apprentissage automatique pour analyser un ensemble de données de 8 719 codas de baleines cachalots collectées par le chercheur Shane Gero au large de la petite île des Caraïbes de l'Est, la Dominique.

« Nous obtenions les données d'entrée puis ajustions notre apprentissage automatique pour mieux visualiser et comprendre », explique Rus. « Et ensuite, nous analyserions les résultats avec un biologiste. »

La méthode de l'équipe a marqué un changement par rapport aux analyses plus anciennes, qui étudiaient les codas individuellement. Une image plus riche se forme lorsque les sons sont étudiés dans un contexte, au sein d'échanges entre les baleines. Les détails contextuels sont classés en utilisant la terminologie musicale. Cela inclut le tempo, le rythme, l'ornementation et le rubato. À partir de là, l'équipe a isolé ce qu'elle appelle un alphabet phonétique de la baleine cachalot.

« Cet alphabet phonétique permet d'expliquer systématiquement la variabilité observée dans la structure des codas », déclare Rus. « Nous pensons qu'il est possible que cela soit la première instance en dehors du langage humain où une communication fournit un exemple du concept linguistique de dualité de la structuration. Cela fait référence à un ensemble d'éléments individuellement insignifiants qui peuvent être combinés pour former des unités plus significatives, comme combiner des syllabes en mots. »

Le sens de ces « mots » prend des significations différentes en fonction du contexte. Le document ajoute :

Nos résultats montrent que les vocalisations des baleines cachalots forment un système de communication combinatoire complexe : l'inventaire en apparence arbitraire des types de codas peut être expliqué par des combinaisons de caractéristiques de rythme, de tempo, de rubato et d'ornementation. Les systèmes de vocalisation combinatoire considérables sont extrêmement rares dans la nature ; cependant, leur utilisation par les baleines cachalots montre qu'ils ne sont pas uniquement humains et peuvent découler de pressions physiologiques, écologiques et sociales radicalement différentes. »

Alors que la percée est excitante pour tous les participants, il reste encore beaucoup de travail à faire, d'abord avec les baleines cachalots, puis éventuellement en élargissant aux autres espèces comme les baleines à bosse.

« Nous avons décidé d'étudier les baleines cachalots car nous disposions d'un ensemble de données étendu et avions la possibilité de collecter de nombreux autres ensembles de données », déclare Rus. « De plus, parce que les clics forment un type de système de communication discret, il est beaucoup plus facile à analyser qu'un système de communication continu. Mais même le travail de Roger Payne a montré que les chansons des baleines à bosse ne sont pas aléatoires. Il y a des segments qui se répètent et il y a une structure intéressante. Nous n'avons tout simplement pas encore pu faire une étude approfondie. »