• Inicio
  • Series y Películas
  • Actualidad
  • Negocios
  • Economía
  • Salud
  • Paises
    • México
    • España
    • Argentina
    • Estados Unidos
  • English
  • Login
Upgrade
Noticias en español para Latinos
  • Inicio
  • Series y Películas
  • Actualidad
  • Negocios
  • Economía
  • Salud
  • Paises
    • México
    • España
    • Argentina
    • Estados Unidos
  • English
No Result
View All Result
  • Inicio
  • Series y Películas
  • Actualidad
  • Negocios
  • Economía
  • Salud
  • Paises
    • México
    • España
    • Argentina
    • Estados Unidos
  • English
No Result
View All Result
Noticias en español para Latinos
No Result
View All Result
Home Sin categoría

Dos estudiantes de pregrado construyeron un modelo de discurso de IA para rivalizar en cuaderno

by
22 abril, 2025
in Sin categoría
0
Dos estudiantes de pregrado construyeron un modelo de discurso de IA para rivalizar en cuaderno
0
SHARES
0
VIEWS
Compártelo en FacebookCompártelo en Twitter

Un par de estudiantes de pregrado, ni con una amplia experiencia en IA, dicen que han creado un modelo de IA abiertamente disponible que puede generar clips de estilo podcast similar al cuaderno de Google.

El mercado de herramientas de habla sintética es vasto y creciente. ElevenLabs es uno de los jugadores más grandes, pero no hay escasez de retadores (ver playai, sésamo, etc.). Los inversores creen que estas herramientas tienen un potencial inmenso. Según Pitchbook, las nuevas empresas que desarrollan Voice Ai Tech recaudaron más de $ 398 millones en fondos de VC el año pasado.

Toby Kim, uno de los cofundadores de Nari Labs, con sede en Corea, el grupo detrás del modelo recién publicado, dijo que él y su compañero cofundador comenzaron a aprender sobre el discurso IA hace tres meses. Inspirados en Notebooklm, querían crear un modelo que ofreciera más control sobre las voces generadas y la «libertad en el guión».

Kim dice que utilizaron el programa TPU Research Cloud de Google, que proporciona a los investigadores acceso gratuito a los chips de IA TPU de la compañía, para capacitar al modelo de Nari, DIA. Con un peso de 1.6 mil millones de parámetros, DIA puede generar diálogo a partir de un script, permitiendo a los usuarios personalizar los tonos de los altavoces e insertar disfluencias, tos, risas y otras señales no verbales.

ADVERTISEMENT

Los parámetros son los modelos de variables internas que se utilizan para hacer predicciones. En general, los modelos con más parámetros funcionan mejor.

Disponible en la plataforma AI Dev Hugging Face y GitHub, DIA puede ejecutarse en la mayoría de las PC modernas con al menos 10 GB de VRAM. Genera una voz aleatoria a menos que se solicite una descripción de un estilo previsto, pero también puede clonar la voz de una persona.

En las breves pruebas de Tecno de DIA a través de la demostración web de Nari, DIA funcionó bastante bien, generando chats bidireccionales sobre cualquier tema. La calidad de las voces parece competitiva con otras herramientas, y la función de clonación de voz se encuentra entre las más fáciles que este reportero ha intentado.

Aquí hay una muestra:

Sin embargo, al igual que muchos generadores de voz, DIA ofrece poco en cuanto a salvaguardas. Sería trivialmente fácil crear desinformación o una grabación de estafa. En las páginas del proyecto de DIA, Nari desalienta el abuso del modelo a hacerse pasar, engañar o participar en campañas ilícitas, pero el grupo dice que «no es responsable» por el mal uso.

Nari tampoco ha revelado qué datos raspó para entrenar a Dia. Es posible que se desarrolle DIA utilizando contenido con derechos de autor: un comentarista en Hacker News señala que una muestra suena como los anfitriones del podcast «Planet Money» de NPR. Los modelos de entrenamiento sobre contenido con derechos de autor es una práctica generalizada pero legalmente dudosa. Algunas compañías de IA afirman que el uso justo los protege de la responsabilidad, mientras que los titulares de derechos afirman que el uso justo no se aplica a la capacitación.

En cualquier caso, Kim dice que el plan de Nari es crear una plataforma de voz sintética con un «aspecto social» además del DIA y los modelos futuros más grandes. Nari también tiene la intención de publicar un informe técnico para DIA y expandir el apoyo del modelo a idiomas más allá del inglés.

Continuar leyendo: Dos estudiantes de pregrado construyeron un modelo de discurso de IA para rivalizar en cuaderno

Related Posts

Aquí está cómo ver Llamacon, el primer evento de desarrollador de IA de Meta
Sin categoría

Aquí está cómo ver Llamacon, el primer evento de desarrollador de IA de Meta

by
29 abril, 2025
Google Wallet Agregar tarjeta NFC Agregar sistema para Android
Sin categoría

Google Wallet Agregar tarjeta NFC Agregar sistema para Android

by Pilar Benegas
29 abril, 2025
Prefiero hacerme el harakiri antes que fracasar
Sin categoría

Prefiero hacerme el harakiri antes que fracasar

by Oliver Roberts
29 abril, 2025
Motorola Edge 60 Pro Review: Hands-On
Sin categoría

Motorola Edge 60 Pro Review: Hands-On

by Pilar Benegas
29 abril, 2025
Spotify agrega a los suscriptores como amantes de la música sintonizan el arancel de Trump ‘Noise’
Sin categoría

Spotify agrega a los suscriptores como amantes de la música sintonizan el arancel de Trump ‘Noise’

by Corresponsal Europa News
29 abril, 2025

Premium Content

Walk no funciona: este científico biomítico advierte que hacer 10,000 pasos para el día «es un tiempo total de tiempo»

Walk no funciona: este científico biomítico advierte que hacer 10,000 pasos para el día «es un tiempo total de tiempo»

8 julio, 2025
El enviado chino golpea las tarifas de Trump como ‘eco de la gran depresión’ – EDL World News

El enviado chino golpea las tarifas de Trump como ‘eco de la gran depresión’ – EDL World News

21 abril, 2025
Herdez planea separar su negocio Nutrisa y listarlo en la Bolsa Mexicana

Bolsa Mexicana perdió, hoy 8 de abril, en una sesión volátil tras amenazas arancelarias

8 abril, 2025

Browse by Tags

adultos mayores cdmx celebridades CFE condado de Orange cosas que hacer deportes deportes universitarios Donald Trump EDOMEX EE.UU entretenimiento Florida Florida Gators Gerard Piqué global horóscopos inteligencia artificial Internacionales Mhoni Vidente México negocio Netflix noticias Noticias del mundo noticias locales noticias nacionales pagar pensionistas pensión de bienestar Pensión IMSS política política nacional puntajes de la escuela secundaria qué ver red SE SENTÓ Shakira signos del zodiaco Socio de contenido Tecno Terra.com.mx transporte público Ángela Aguilar Últimos titulares

Red de Noticias

Noticias de Miami

Promociones Argentinas

Diario de Inteligencia Artificial

Jimena Diaz Diario UNO

Es De Latino News

Noticias en español para Latinos

Noticias en español para Estados Unidos y LatinoAmérica

Acerca de EDL

Quienes Somos EDL

Contactar Es de Latino

Términos y Condiciones

2025 - Todos los derechos reservados -Evisos

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Inicio
  • Series y Películas
  • Actualidad
  • Negocios
  • Economía
  • Salud
  • Paises
    • México
    • España
    • Argentina
    • Estados Unidos
  • English

2025 - Todos los derechos reservados -Evisos

Ir a la versión móvil