Neurocientíficos sorprenden con una IA que puede descifrar con el canto de los canarios el lenguaje humano

0
36

Durante años, el análisis del canto de los animales ha sido un trabajo casi artesanal para la ciencia: horas de grabaciones, fragmentos revisados manualmente y datos etiquetados uno a uno por expertos humanos. Pero ese modelo empieza a cambiar con una nueva herramienta que está llamando la atención de neurocientíficos: TweetyBERT.

Desarrollado por investigadores de la Universidad de Oregón, este sistema de aprendizaje automático ha demostrado algo que hasta hace poco parecía inalcanzable: es capaz de segmentar y clasificar vocalizaciones de canarios sin necesidad de grandes bases de datos previamente etiquetadas. En otras palabras, puede «escuchar» primero y entender después.

A diferencia de los sistemas tradicionales, que dependen de la intervención humana para identificar patrones en los sonidos, TweetyBERT utiliza un enfoque autosupervisado. Esto le permite analizar grabaciones sin etiquetar, detectar unidades de comunicación y reconstruir secuencias completas de canto con una precisión comparable a la de expertos.

Este avance no solo reduce el tiempo de análisis, sino que abre la puerta a estudiar grandes volúmenes de datos vocales animales que antes eran demasiado complejos o costosos de procesar.

Más allá de los pájaros: una ventana al cerebro del lenguaje

El interés de este modelo no se limita a la ornitología. Para la neurociencia, herramientas como TweetyBERT representan una oportunidad única para explorar cómo se organizan los sistemas de comunicación en el cerebro.

Comprender cómo los canarios aprenden, estructuran y reproducen sus cantos podría ofrecer pistas sobre algo mucho más amplio: los mecanismos neuronales que hacen posible el lenguaje, tanto en animales como en humanos.

El estudio, publicado en la revista científica Patterns, sugiere que este tipo de inteligencia artificial puede convertirse en una plataforma escalable para investigar la comunicación biológica de una forma antes imposible.

 Un cambio de perspectiva

Más que una simple herramienta técnica, los científicos plantean un cambio de mirada: pasar de analizar el sonido como datos aislados a interpretarlo como estructura, ritmo y posible significado.

Sin afirmar que los canarios «hablan» como humanos, la investigación sí muestra que sus vocalizaciones contienen patrones complejos que ahora pueden estudiarse con una profundidad inédita.

En ese sentido, «entrar en TweetyBERT» no es sólo usar una IA, sino acceder a una nueva forma de escuchar la naturaleza: una en la que el lenguaje no siempre necesita palabras para empezar a tener sentido.

Red neuronal

La herramienta adapta BERT, la arquitectura de IA lingüística subyacente a las primeras versiones de grandes modelos lingüísticos como ChatGPT, para gestionar la singular estructura acústica del canto de las aves. Esta red neuronal transformadora autosupervisada está entrenada para predecir fragmentos de audio enmascarados u ocultos sin necesidad de supervisión humana ni etiquetas, y aprende de forma autónoma las unidades de comportamiento del canto (como notas, sílabas y frases), con un rendimiento similar al de los anotadores expertos.

Esta capacidad de clasificar y anotar cantos rápidamente, detectando diferencias entre individuos y rastreando cómo cambian con el tiempo, puede ayudar a los neurocientíficos a descubrir los fundamentos neuronales de cómo el cerebro aprende y produce el lenguaje.

Población de aves

Más allá de la neurociencia, con modificaciones, el sistema podría aplicarse a poblaciones naturales de aves, identificando cambios en los patrones vocales que podrían revelar cómo las aves están respondiendo a la expansión de la infraestructura humana y al cambio climático.

«Lo desarrollamos para canarios, pero el enfoque subyacente no es específico para cada especie, y el mundo está lleno de aves cuyo comportamiento vocal apenas rastreamos. Con algunas modificaciones, estas aplicaciones empiezan a ser muy diferentes», finaliza Gardner.

El enfoque subyacente ya se está utilizando con delfines y ballenas, lo que sugiere que podría extenderse mucho más allá de las aves y profundizar nuestra comprensión de la comunicación animal de manera más amplia.