El Traductor de Google incorporó 110 nuevos idiomas, permitiendo traducciones para el 8% de la población mundial, de acuerdo con un comunicado del gigante tecnológico. Entre las más recientes incorporaciones con inteligencia artificial, se encuentran múltiples lenguas indígenas de México.
Las lenguas indígenas ya disponibles en el Traductor de Google
Los nuevos idiomas incorporados a “Google Translate” representan 614 millones de hablantes, inclyendo a los hablantes nativos y no nativos de lenguas indígenas, entre las cuales se encuentran:
- Náhuatl (Huasteca oriental)
- Maya yucateco
- Zapoteco
- Quekchí (Hablado en Campeche y Quintana Roo)
Fuente: Google
El total de los 110 nuevos idiomas del Traductor de Google ya comenzaron a integrarse a la plataforma y llegarán todos a los usuarios progresivamente.
Entre ellos, llegarán también el K’iche’ y el Ta Yol Mam, que se hablan en Guatemala y México, de acuerdo con el medio Wired en Español con base en la empresa de tecnología.
[TE RECOMENDAMOS: Gemini: Google prepara voces para personalizar su IA]
Otros idiomas que se agregan al Traductor de Google
Aproximadamente una cuarta parte de los nuevos idiomas provienen de África, incluidos fon, kikongo, luo, ga, swati, venda y wolof. Estos son algunos de los idiomas recientemente admitidos en Google Translate:
- Afar: lengua tonal hablada en Djibouti, Eritrea y Etiopía; el idioma con la mayor cantidad de contribuciones comunitarias voluntarias en el Traductor de Google.
- Cantonés: uno de los idiomas más solicitados para Google Translate. Apenas se agrega debido a que se superpone con el mandarín en la escritura, por lo que es complicado encontrar datos y entrenar modelos.
- Manx: la lengua celta de la Isla de Man. Casi se extinguió con la muerte de su último hablante nativo en 1974. Pero gracias a un movimiento de reactivación en toda la isla, ahora hay miles de hablantes.
- Nko: una forma estandarizada de las lenguas mandingas de África occidental. Su alfabeto único fue inventado en 1949 y cuenta con una comunidad de investigación activa que desarrolla recursos y tecnología para él en la actualidad.
- Punjabi (Shahmukhi): la variedad de punjabi escrito en escritura persoárabe (Shahmukhi) y es el idioma más hablado en Pakistán.
- El tamazight (amazigh): lengua bereber que se habla en todo el norte de África. Está escrito en escritura latina y tifinagh, ambas compatibles con Google Translate.
- Tok Pisin: criollo de origen inglés y la lengua franca de Papúa Nueva Guinea. “Si hablas inglés, intenta traducir al Tok Pisin: ¡tal vez puedas entender el significado!”, dice el Traductor de Google.
El enfoque es priorizar las variedades más utilizadas de cada idioma. Por ejemplo, el romaní es una lengua que tiene muchos dialectos en toda Europa. El Vlax Romani suereño, relacionado con el Vlax del Norte y el Romaní de los Balcanes.
¡Este es un logro de la inteligencia artificial!
Las más recientes adiciones del Traductor de Google fueron posibles gracias al modelo de lenguaje grande PaLM 2, en la que es la mayor expansión de la plataforma, según anunció el buscador el 27 de junio.
PaLM 2 ayudó a Translate a aprender de manera más eficiente idiomas que están estrechamente relacionados entre sí, incluidos idiomas cercanos al hindi, como el awadhi y el marwadi, y criollos franceses como el criollo de Seychelles y el criollo de Mauricio.
“A medida que avance la tecnología y sigamos asociándonos con lingüistas expertos y hablantes nativos, con el tiempo admitiremos aún más variedades lingüísticas y convenciones ortográficas”, remató Google.