Microsoft traduce voz a cualquier idioma

Este desarrollo solo requiere una muestra de audio de tres segundos para entrenar a este bot de inteligencia artificial de Microsoft

Por iProfesional

10/03/2023 – 09:51

VALLELa tecnología de texto a voz basada en inteligencia artificial de Microsoft ahora es capaz de traducir su voz a casi cualquier idioma que desee, y es increíblemente similar al habla humana.

La tecnología de texto a voz basada en IA ha recorrido un largo camino en los últimos años, y VALL-E es el modelo para microsoft es un ejemplo de este progreso. Con su capacidad para generar un habla humana realista en una variedad de idiomas y acentos, establece un nuevo estándar para los modelos de texto a voz.

Este modelo se basa en la arquitectura Transformer, al igual que ChatGPT o Bard, que demostró ser efectivo para una variedad de tareas de procesamiento de lenguaje natural de una manera más simple y rápida.

Una vez entrenado, puede replicar muy bien la voz de una persona. Solo requiere una muestra de audio de tres segundos para entrenar a este bot de inteligencia artificial de Microsoft.

Microsoft agregó una función a VALL-E: la capacidad de traducir su voz a idiomas extranjeros con emociones y tonos sin notar la diferencia. En el siguiente ejemplo puedes escuchar cómo funciona:

«Proponemos un modelo de lenguaje de códec neuronal multilingüe, VALL-E X, para la síntesis de voz multilingüe. Específicamente, ampliamos VALL-E y esta novedad alivia efectivamente los problemas de acento extranjero, que pueden ser controlados por un identificación del idioma«, explicó Microsoft en un comunicado.

La inteligencia artificial es una tendencia casi omnipresente en la conversación tecnológica actual.

La inteligencia artificial es una tendencia casi omnipresente en la conversación tecnológica actual.

Inteligencia artificial: una arquitectura de software clave

La arquitectura transformador es una red neuronal que ha demostrado ser eficaz para las tareas de procesamiento del lenguaje natural, incluida la traducción de idiomas, el modelado de idiomas y el resumen de texto.

El transformador también se puede adaptar a una amplia gama de tareas. Esto lo convierte en una buena opción para los modelos de procesamiento de lenguaje natural como VALL-E de Microsoft, que lo utilizan para generar un habla muy realista y similar a la de un humano.

A principios de este año, el cofundador de Microsoft Bill GatesDijo que la inteligencia artificial es el próximo gran avance en la industria de la tecnología y traerá los cambios más importantes en los próximos años. «VALL-E X puede sintetizar el habla de destino personalizada mientras mantiene la emoción en el habla de origen», explicó Microsoft.



Con información de Telam, Reuters y AP

Salir de la versión móvil