Un par de ingenieros desarrollaron una herramienta basada en inteligencia artificial (IA) que permitiría la preservación de lenguas en peligro de extinción con pocos o ningún recurso.
En una entrevista con WIRED, los ingenieros Jared Coleman y Bhaskar Krishnamachari, de la Universidad del Sur de California, revelaron el desarrollo de una herramienta de IA diseñada para rescatar el paiut, una lengua indígena del Valle de Owens.
Jared Coleman, quien recientemente obtuvo su doctorado en Ciencias de la Computación, tiene una conexión personal con el paiut, el idioma de su tribu, Big Pine Paiute del Valle de Owens.
Motivado por la falta de recursos para aprender su lengua ancestral, Coleman se decidió usar ChatGPT para explorar y aprender el idioma. “Soy nativo americano y el idioma nativo de mi tribu siempre me ha interesado. He tomado clases y demás, pero es muy difícil aprender un idioma en peligro de extinción porque no hay tantos recursos ni herramientas disponibles,” explicó Coleman a WIRED .
El enfoque innovador desarrollado por Coleman y su profesor, Bhaskar Krishnamachari, combina traductores basados en reglas con grandes modelos lingüísticos (LLM), creando un sistema práctico y eficaz para idiomas con pocos recursos. “La herramienta es lo suficientemente inteligente, con algunas pistas, como para poder realizar gran parte de la traducción por sí sola,” señaló Krishnamachari.
[TE RECOMENDAMOS: Traductor de Google incorpora lenguas indígenas de México como maya y náhuatl]
Uno de los mayores desafíos que enfrentaron fue la necesidad de expertos en el idioma para proporcionar reglas y construir frases simples.
Superaron esto simplificando frases complejas para que el modelo las tradujera en partes manejables, manteniendo el significado original. También desarrollaron un esquema de evaluación de traducción de ida y vuelta y una tecnología de similitud semántica para medir la retención del significado de las frases durante la traducción .
El trabajo de Coleman y Krishnamachari tiene un potencial enorme para la preservación de idiomas en peligro de extinción en todo el mundo. “Actualmente, hay aproximadamente 7 mil idiomas en el mundo clasificados como en peligro de extinción. Si podemos desarrollar herramientas computacionales que ayuden a preservar estos idiomas, estaremos protegiendo una parte esencial de la experiencia humana y nuestro patrimonio,” destacó Krishnamachari.
El equipo espera que su método pueda aplicarse a otros idiomas en peligro de extinción. “Esperamos que nuestro trabajo sea aplicable a otros idiomas en peligro de extinción tanto en los Estados Unidos como en el extranjero,” mencionó Coleman.
Además, Krishnamachari señaló que futuras investigaciones podrían integrar tecnologías de texto a voz y voz a texto, así como la realidad virtual, para crear entornos inmersivos que faciliten el aprendizaje y preservación de idiomas.