La startup de voz sintética Murf presta una voz a los creadores de contenido de todos los tamaños • Tecno

La startup de tecnología de voz sintética Murf da voz, literalmente, a los creadores de contenido de todos los tamaños. Murf, que ahora tiene una biblioteca de más de 120 voces de IA de paridad humana en 20 idiomas, anunció hoy que ha recaudado $ 10 millones en fondos de la Serie A liderados por socios de Matrix. La participación provino de los inversionistas recurrentes Elevation Capital y varios inversionistas ángeles prominentes como el fundador de Ola, Ankit Bhai; Disney Streaming SVP de producto; Ashwini Asokan, el fundador de Mad Street Dap; y Pushkar Mukewar, fundador de Drip Capital

Fundada en octubre de 2020 por los amigos de la escuela IIT-Kharagpur Sneha Roy, Ankur Edkie y Divyanshu Pandey, el anuncio de financiación anterior de Murf fue una semilla de $ 1.5 millones liderada por Elevation Capital e inversores ángeles que los ayudaron a reclutar talento, invertir en innovación de productos y adquisición de usuarios. Murf dice que desde su ronda inicial, ha crecido 26 veces en ARR y ha sintetizado más de un millón de proyectos de voz en off, en una amplia variedad de estilos y tonos de voz.

Algunos ejemplos de cómo se ha utilizado la tecnología de Murf incluyen a un empresario tecnológico y artista que crea una película completa utilizando modelos artísticos de IA, programas falsos profundos y AI Voices del estudio Murf; una agencia de animación de entretenimiento que creó una serie de televisión utilizando una colección de voces de Murf; autores que crean audiolibros de ficción fantástica con las voces de IA de Murf; y un influencer de YouTube que usó la voz de IA de Murf para crear un video de rap.

Los fundadores de Murf

Edkie, el CEO de Murf, le dijo a Tecno que aunque el equipo fundador de Murf trabajó en diferentes dominios en el pasado, todos se encontraron con los puntos débiles de la creación de voces en off de alta calidad. Esto incluyó la creación y actualización de demostraciones de productos y la grabación de anuncios de radio y video. Agregó que la pandemia “brindó un impulso a la creación multimedia y la demanda de contenido de audio escalable estaba creciendo rápidamente”.

Los clientes de Murf lo han utilizado de diversas formas, incluida la publicidad, los audiolibros, los videos explicativos y el aprendizaje electrónico. Murf.ai, su plataforma SaaS, se desarrolló para facilitar a los clientes la creación de locuciones de sonido natural de alta calidad para cualquier propósito comercial. Los clientes de la compañía varían en tamaño, desde creadores de contenido individuales hasta PYMES y empresas, y trabajan en sectores como educación, corporativo, atención médica, medios y entretenimiento, marketing, publicidad, podcasting, atención al cliente y más.

Edkie, le dijo a Tecno que los creadores de contenido y los equipos de marketing a menudo graban las voces en off ellos mismos o subcontratan todo el proceso, los cuales son «engorrosos, costosos y lentos». Murf, por otro lado, permite a los usuarios generar voces en off «similares a las humanas» sin necesidad de comprar equipos de grabación o contratar a un locutor.

La compañía también quiere eliminar las limitaciones sobre lo que puede hacer el texto a voz. “Si bien TTS existe desde hace bastante tiempo, las limitaciones en la calidad de la voz han restringido su uso. Al aprovechar los avances recientes en inteligencia artificial y aprendizaje profundo, estamos haciendo posible la creación de voces sintéticas de alta fidelidad que imitan la prosodia natural y la pronunciación del habla humana”.

La plataforma de Murf incluye una herramienta SaaS habilitada para IA que ayuda a los usuarios a generar voces «similares a las humanas», generalmente para usar en videos o presentaciones, sin tener que adquirir un equipo de grabación complejo y costoso o contratar a un locutor. Los creadores de contenido pueden usar la cabina de grabación de voz en línea, donde pueden probar una amplia gama de estilos de habla. Murf quiere cerrar la brecha de diversidad en las plataformas tradicionales de texto a voz al incluir voces en todos los acentos, como afroamericano, británico, australiano y otros.

Según los informes de mercado utilizados por los fundadores de Murf, se espera que el mercado mundial de texto y voz alcance los 7060 millones de dólares para 2028, con un crecimiento CAG del 14,6 %. Mientras tanto, se prevé que los mercados de locución y doblaje generen un total de $ 8 mil millones anuales para 2027.

El texto a voz ha existido durante años, pero las limitaciones de calidad significaron que fueron utilizados principalmente por asistentes de voz y bots de chat. Pero los desarrollos recientes en inteligencia artificial y aprendizaje profundo ahora significan que es posible crear voces sintéticas que tengan la prosodia y la pronunciación del habla humana. El motor de IA de Murf está entrenado en horas de habla humana real y Murf Studios ofrece más de 120 voces de IA de variedad humana, que pueden hablar en 20 idiomas. Murf también está trabajando para traer acentos más diversos al asociarse con actores de doblaje para traer voces al extranjero como las afroamericanas, británicas e inglesas australianas.

El texto a voz impulsado por IA de Murf también puede aprender de la información contextual para devolver las respuestas correctas. Los fundadores describen a Murf como una «solución de voz todo en uno» que permite a los usuarios agregar imágenes, videos y música de fondo. También tiene características para la pronunciación utilizando el alfabeto fonético internacional (IPA), personalizaciones de voz que cambian el tono, la pausa, el énfasis y la velocidad de los usuarios.

Murf gana dinero a través de un plan de suscripción para sus servicios. Salió de la prueba beta en enero de 2021 y, en los últimos 18 meses, ha crecido 22 veces en ARR y ha sintetizado más de un millón de proyectos de voz en off hasta la fecha.

Edkie dijo que los principales competidores de Murf son las grandes empresas de tecnología y nube, como Google, Amazon, Polly y Microsoft, que tienen las plataformas de texto a voz líderes en el mercado. Murf se distingue por sus voces de IA de sonido natural que también admiten múltiples acentos y estilos.

“Yendo más allá de una simple herramienta de texto a voz, nuestra plataforma ofrece a los usuarios la capacidad de agregar imágenes, videos, presentaciones y voz en off, incluir música de fondo y sincronizarlos por completo para crear contenido atractivo”, dijo Edkie. El TTS impulsado por IA de Murf también puede aprender de grandes cantidades de información contextual para crear un discurso contextual. Por ejemplo, tiene una conciencia de contexto incorporada que puede reconocer formatos de entidad de uso común como números, monedas, porcentajes, direcciones, fechas y horas, reduciendo su aleatoriedad y acercándolos a un estándar predefinido, agregó Edkie.

En una declaración preparada, el socio codirector de Elevation Capital, Mukul Arora, dijo: “Las voces en off realistas impulsadas por IA son la próxima frontera en el mercado de texto a voz. Murf, con su equipo fundador estelar y su IP única, está perfectamente preparado para obtener una posición de liderazgo en este espacio. Su destreza en la ejecución y su enfoque en la tecnología primero son evidentes en la sólida tracción y el crecimiento que han demostrado hasta ahora. Estamos muy emocionados de duplicar nuestra asociación con Murf”.

Continuar leyendo: La startup de voz sintética Murf presta una voz a los creadores de contenido de todos los tamaños • Tecno