Google incluye quechua, guaraní y aimara en su traductor

El gigante de Internet dice que la nueva tecnología de inteligencia artificial le permite ampliar enormemente el repertorio de idiomas de su traductor. La firma sumó 24 esta semana, entre ellos el quechua y otras lenguas indígenas sudamericanas como el guaraní y el aimara. Google también agregó varios idiomas africanos y del sur de Asia ampliamente hablados que no han estado en productos tecnológicos populares.

“Observamos idiomas con poblaciones desatendidas muy grandes”, dijo a los periodistas Isaac Caswell, científico investigador de Google.


La noticia anunciada en la feria anual de tecnología I/O de la compañía de California podría celebrarse en muchos rincones del mundo. Pero es probable que también genere críticas de aquellos que se han sentido frustrados con productos tecnológicos anteriores que no lograron captar los matices de su idioma o cultura.

El quechua era la lengua franca del imperio inca, que se extendía desde lo que ahora es el sur de Colombia hasta el centro de Chile. Su situación comenzó a decaer después de que los españoles conquistaran Perú hace más de 400 años.

La inclusión del quechua entre los idiomas reconocidos por Google es una gran victoria para los activistas de ese idioma como Luis Illaccvanqui, un peruano que creó el sitio web Qichwa 2.0, que incluye diccionarios y recursos para aprenderlo.


“Ayudará a que el quechua y el español tengan el mismo estatus”, dijo Illaccanqui, quien no participó en el proyecto de Google y cuyo apellido significa “eres un rayo” en quechua.

Illaccanqui dijo que el traductor también ayudará a mantener vivo ese idioma en una nueva generación de jóvenes y adolescentes “que hablan quechua y español al mismo tiempo y les fascinan las redes sociales”.

Deberías leer:   ¡Qué se vayan al carajo! los que rechazan a médicos cubanos

Caswell calificó la noticia como un “avance tecnológico muy grande” porque hasta hace poco era imposible agregar idiomas si los investigadores no podían encontrar una colección lo suficientemente grande de textos en línea -como libros digitales, periódicos o mensajes difundidos en las redes sociales- de que sus sistemas de IA podrían aprender.

Los gigantes tecnológicos de Estados Unidos no tienen un largo historial de hacer que su tecnología lingüística funcione bien fuera de los mercados más ricos, un problema que también les ha dificultado detectar desinformación peligrosa en sus plataformas. Hasta esta semana, Google Translate funcionaba para idiomas europeos como el frisón, el maltés, el islandés y el corso, cada uno con menos de un millón de hablantes, pero no para idiomas de África oriental como el oromo y el corso. Tigrinya, que tienen millones de hablantes.

Los nuevos idiomas estarán disponibles esta semana. El asistente de voz de Google aún no los entenderá, lo que limitará el servicio a la traducción de texto a texto por ahora. La compañía dijo que está trabajando en el reconocimiento de voz y otras capacidades, como poder traducir señales apuntándolas con la cámara.

Esto será importante para los idiomas mayoritariamente orales, como el quechua, especialmente en el ámbito médico, porque muchos médicos y enfermeras peruanos que solo hablan español trabajan en zonas rurales y “no pueden entender a los pacientes que hablan principalmente quechua”, señaló Illaccanqui. afuera.

“La próxima frontera o desafío es trabajar en torno al habla”, dijo el peruano Arturo Oncevay, investigador de traducción automática de la Universidad de Edimburgo y cofundador de una coalición de investigación que busca mejorar la tecnología de las lenguas indígenas en las Américas. “Las lenguas originarias del continente americano son tradicionalmente orales”.

Deberías leer:   Queremos que esa perla del Caribe vuelva a brillar

En su anuncio, Google advirtió que la calidad de las traducciones en los nuevos idiomas incluidos “todavía está muy lejos” de la de otros idiomas que ya tiene, como el inglés, el español y el alemán, y destacó que los modelos ” cometerán errores y exhibirán sus propios prejuicios”. Pero la compañía solo agrega idiomas si sus sistemas de inteligencia artificial alcanzan un cierto umbral de competencia, dijo Caswell.

“Si hay un número significativo de casos en los que está seriamente mal, entonces no lo incluiríamos”, agregó. “Incluso si el 90 % de las traducciones son perfectas, pero el 10 % son tonterías, eso es un poco excesivo para nosotros”. .

Google dijo que sus productos ya incluyen 133 idiomas. Los 24 más recientes son el lote más grande agregado desde que la compañía agregó 16 en 2010. Lo que hizo posible la expansión es lo que Google llama un modelo de traducción automática de “intento cero” o “recurso cero”, que aprende a traducir otro idioma sin haber visto un ejemplo de ello.

Meta, la empresa matriz de Instagram y Facebook, introdujo un concepto similar el año pasado llamado Universal Speech Translator.

El modelo de Google funciona entrenando un “modelo neuronal de IA gigante único” en aproximadamente 100 idiomas diferentes para los cuales hay una gran cantidad de datos, y luego aplica lo que aprende a cientos de otros idiomas que no conoce, dijo Caswell. .

Deberías leer:   seguiré pidiendo la libertad de mi hijo

“Imagina que eres un gran políglota y luego simplemente empiezas a leer novelas en otro idioma; pueden comenzar a reconstruir lo que podría significar en función de sus habilidades lingüísticas generales”, señaló.

Dijo que el nuevo grupo abarca desde idiomas más pequeños como el mizo, hablado en el noreste de India por unas 800.000 personas, hasta idiomas más hablados como el lingala, utilizado por unos 45 millones de personas en el centro de África.

Hace más de 15 años, en 2006, Microsoft recibió algunos elogios en América del Sur por un software que traducía menús y comandos familiares de la empresa al quechua. Pero eso fue antes de la ola actual de avances de IA en traducciones en tiempo real.

Américo Mendoza Mori, investigador de idiomas de la Universidad de Harvard que habla quechua, dijo que el hecho de que Google le haya puesto atención a este idioma le da una visibilidad necesaria en lugares como Perú, donde los quechuahablantes aún carecen de muchos servicios públicos. . La supervivencia de muchos de estos lenguajes “dependerá de su uso en contextos digitales”, dijo.

Otro lingüista, Roberto Zariquey, dijo que era escéptico de que Google pudiera crear una herramienta efectiva de revitalización del idioma para el quechua, el aymara o el guaraní sin la participación cercana de los grupos comunitarios de la región.

Los idiomas están muy ligados a la vida, las culturas, las etnias y las organizaciones políticas, dijo Zariquiey, lingüista de la Pontificia Universidad Católica del Perú. Esto hay que tenerlo en cuenta, afirmó.