Un equipo de investigadores de la Universidad de Oregón ha desarrollado una innovadora herramienta de inteligencia artificial, denominada TweetyBERT, capaz de analizar el canto de los canarios con una precisión comparable a la de expertos humanos, pero sin la necesidad de un etiquetado manual previo. Este avance, que promete transformar la neurociencia, también podría ofrecer una perspectiva invaluable para el seguimiento de las dinámicas de comunicación en poblaciones animales silvestres.
Aunque los canarios no se convertirán en traductores del lenguaje humano de la noche a la mañana, su melodía ha proporcionado un paso fundamental en la comprensión de cómo el cerebro asimila, organiza y emite secuencias vocales complejas. TweetyBERT, un modelo de aprendizaje automático, fue presentado en la revista Patterns el 3 de marzo de 2026, abriendo nuevas fronteras en este campo.
Tradicionalmente, las herramientas de inteligencia artificial empleadas para estudiar las vocalizaciones animales requerían un laborioso proceso de etiquetado manual de miles de fragmentos de audio, lo que limitaba su escalabilidad y eficiencia. Tim Gardner, profesor asociado de bioingeniería en la Universidad de Oregón, señala que TweetyBERT es capaz de procesar grabaciones sin etiquetar, identificar unidades comunicativas y registrar secuencias, lo que se traduce en una reducción significativa del trabajo manual y una mayor velocidad para analizar cantos elaborados.
La elección de los canarios como objeto de estudio por parte de los neurocientíficos no es casual. Estas aves son conocidas por su capacidad de aprender y producir cantos complejos a lo largo de su vida, lo que las convierte en un modelo idóneo para investigar los comportamientos aprendidos. Sus cantos, lejos de ser meras repeticiones, pueden contener entre 30 y 40 sílabas distintas, encadenadas en secuencias estructuradas que demuestran memoria y organización.
George Vengrovski, estudiante de posgrado del laboratorio de Gardner, fue el cerebro detrás del desarrollo de TweetyBERT, con el objetivo de automatizar la anotación de los cantos. Este sistema adapta la arquitectura BERT, utilizada en el procesamiento del lenguaje humano, al ámbito acústico de las aves. Esto implica que el modelo aprende a partir de fragmentos de audio ocultos, infiriendo el contenido faltante, y opera con una resolución temporal diez veces superior a la de muchos modelos diseñados para el habla humana.
El estudio demuestra que TweetyBERT aprende de forma autónoma las unidades del canto, como notas, sílabas y frases, y las agrupa de manera que se asemeja mucho a las anotaciones realizadas por expertos humanos. En pruebas con datos no vistos durante el entrenamiento, el modelo preentrenado logró una tasa de error global del 2,5%, muy cercana al 1,3% de una versión completamente supervisada. Esto significa que el sistema puede funcionar casi tan bien como un modelo alimentado con etiquetas humanas, pero con una dependencia mucho menor del trabajo previo, lo que representa un cambio fundamental.
Además, el estudio reveló un aspecto fascinante sobre la evolución del canto de los canarios. Los autores observaron que la representación interna del modelo permanecía estable durante una misma estación, pero mostraba variaciones claras entre el canto de primavera y el de otoño. Este hallazgo concuerda con el conocimiento científico de que el canto de los canarios se modifica con las estaciones, reflejando procesos de plasticidad neural. En otras palabras, TweetyBERT no solo clasifica sonidos, sino que también puede ser una herramienta para rastrear la evolución de los repertorios vocales.
Este descubrimiento tiene implicaciones significativas para la conservación y el estudio del medio ambiente. Gardner destaca que el enfoque de TweetyBERT no se limita a una única especie, sugiriendo que, con ciertas adaptaciones, podría aplicarse a poblaciones de aves en la naturaleza para detectar cambios en sus patrones vocales. Esta capacidad permitiría monitorear la respuesta de las aves a factores como la expansión de infraestructuras humanas o el cambio climático. En un mundo donde el ruido, las carreteras y la presión sobre los hábitats aumentan, una mejor comprensión de la comunicación aviar puede revelar información crucial.
La Universidad de Oregón también menciona que este enfoque ya se está aplicando al estudio de la comunicación en delfines y ballenas, lo que subraya su amplio potencial en el análisis de la comunicación animal. Es importante aclarar que el estudio no sugiere una inminente traducción de las conversaciones animales a un lenguaje humano. Más bien, presenta una herramienta novedosa para identificar patrones en volúmenes masivos de audio que antes eran difíciles de organizar. Esta capacidad será invaluable para la ecología del comportamiento y el monitoreo de la fauna.
A pesar de su prometedor potencial, es crucial reconocer las limitaciones de TweetyBERT. El artículo señala que el modelo fue entrenado con aproximadamente 15 horas de grabaciones de tres canarios, y que se utilizó un detector de canto para filtrar llamadas, ruidos de jaula y largos periodos de silencio. Los autores también admiten que aún no se ha evaluado completamente el rendimiento de TweetyBERT en entornos con mayor ruido ambiental o con especies poco estudiadas, y que persisten algunas diferencias en comparación con las etiquetas humanas. Estas consideraciones resaltan la distinción entre una herramienta con gran potencial y una herramienta ya establecida para el trabajo de campo.
En esencia, el valor de TweetyBERT no radica en la idea de que un canario pueda “hablar” como un humano, sino en su capacidad más seria y útil de organizar sonidos complejos a gran escala, detectar regularidades, rastrear cambios a lo largo del tiempo y proporcionar a la neurociencia y la biología del comportamiento una forma más rápida de escuchar lo que antes se perdía entre miles de horas de grabación. A veces, el verdadero progreso no se encuentra en hacer más ruido, sino en aprender a escuchar con mayor atención.