Por que la clonación de la voz de Anthony Bourdain asusta a la gente

La revelación de que un documentalista usó software de clonación de voz para hacer que el difunto chef Anthony Bourdain dijera palabras que nunca pronunció ha generado críticas en medio de preocupaciones éticas sobre el uso de la poderosa tecnología.

La película «Roadrunner: A Film About Anthony Bourdain» apareció en los cines el viernes y en su mayoría presenta imágenes reales del amado chef famoso y presentador de televisión trotamundos antes de morir en 2018. Pero su director, Morgan Neville, le dijo a The New Yorker que un El fragmento de diálogo se creó utilizando tecnología de inteligencia artificial.

Eso ha renovado un debate sobre el futuro de la tecnología de clonación de voz, no solo en el mundo del entretenimiento, sino también en la política y en un sector comercial de rápido crecimiento dedicado a transformar el texto en un habla humana con un sonido realista.

«La clonación de voz no aprobada es una pendiente resbaladiza», dijo Andrew Mason, fundador y director ejecutivo del generador de voz Descript, en una publicación de blog el viernes. «Tan pronto como entras en un mundo en el que estás haciendo juicios subjetivos sobre si casos específicos pueden ser éticos, no pasará mucho tiempo antes de que todo sea válido».

Antes de esta semana, la mayor parte de la controversia pública en torno a estas tecnologías se centró en la creación de deepfakes difíciles de detectar utilizando audio y / o video simulados y su potencial para alimentar la desinformación y el conflicto político.

Pero Mason, quien anteriormente fundó y dirigió Groupon, dijo en una entrevista que Descript ha rechazado repetidamente las solicitudes para recuperar una voz, incluso de «personas que han perdido a alguien y están en duelo».

«Ni siquiera es tanto que queramos emitir un juicio», dijo. «Solo estamos diciendo que debes tener algunas líneas claras en lo que está bien y lo que no».

Las reacciones enojadas e incómodas a la clonación de voces en el caso Bourdain reflejan expectativas y problemas de divulgación y consentimiento, dijo Sam Gregory, director de programas de Witness, una organización sin fines de lucro que trabaja en el uso de tecnología de video para los derechos humanos. Habría sido apropiado obtener el consentimiento y revelar la tecnología en el trabajo, dijo. En cambio, los espectadores se sorprendieron, primero por el hecho de la falsificación de audio, luego por la aparente desestimación del director de cualquier pregunta ética, y expresaron su disgusto en línea.

«También toca nuestros miedos a la muerte y las ideas sobre la forma en que la gente podría tomar el control de nuestra semejanza digital y hacernos decir o hacer cosas sin ninguna forma de detenerlo», dijo Gregory.

Neville no ha identificado qué herramienta usó para recrear la voz de Bourdain, pero dijo que la usó para algunas oraciones que Bourdain escribió pero nunca dijo en voz alta.

«Con la bendición de su patrimonio y agente literario, usamos tecnología de inteligencia artificial», dijo Neville en una declaración escrita. «Era una técnica moderna de narración de historias que usé en algunos lugares donde pensé que era importante hacer que las palabras de Tony cobren vida».

Neville también le dijo a la revista GQ que obtuvo la aprobación de la viuda y albacea literaria de Bourdain. La esposa del chef, Ottavia Busia, respondió con un tweet: «Ciertamente NO fui yo quien dijo que Tony habría estado bien con eso».

Aunque gigantes tecnológicos como Microsoft, Google y Amazon han dominado la investigación de texto a voz, ahora también hay una serie de nuevas empresas como Descript que ofrecen software de clonación de voz. Los usos van desde chatbots de servicio al cliente parlantes hasta videojuegos y podcasting.

Muchas de estas empresas de clonación de voz presentan de forma destacada una política de ética en su sitio web que explica los términos de uso. De casi una docena de firmas contactadas por The Associated Press, muchas dijeron que no recrearon la voz de Bourdain y que no lo harían si se les preguntara. Otros no respondieron.

«Tenemos políticas bastante sólidas sobre lo que se puede hacer en nuestra plataforma», dijo Zohaib Ahmed, fundador y director ejecutivo de Resemble AI, una empresa de Toronto que vende un servicio de generador de voz AI personalizado. «Cuando creas un clon de voz, se requiere el consentimiento de quien sea la voz».

Ahmed dijo que las raras ocasiones en las que ha permitido una clonación de voz póstuma fueron para investigación académica, incluido un proyecto que trabaja con la voz de Winston Churchill, quien murió en 1965.

Ahmed dijo que un uso comercial más común es editar un anuncio de televisión grabado por actores de voz reales y luego personalizarlo para una región agregando una referencia local. También se usa para doblar películas de anime y otros videos, al tomar una voz en un idioma y hacer que hable un idioma diferente, dijo.

Lo comparó con innovaciones pasadas en la industria del entretenimiento, desde actores de acrobacias hasta tecnología de pantalla verde.

Solo unos segundos o minutos de voz humana grabada pueden ayudar a enseñar a un sistema de inteligencia artificial a generar su propia voz sintética, aunque lograr que capture la claridad y el ritmo de la voz de Anthony Bourdain probablemente requirió mucho más entrenamiento, dijo Rupal Patel, profesor de la Universidad Northeastern. que dirige otra empresa generadora de voz, VocaliD, que se centra en chatbots de servicio al cliente.

«Si quisieras que hablara realmente como él, necesitarías mucho, tal vez 90 minutos de datos buenos y limpios», dijo. «Estás construyendo un algoritmo que aprende a hablar como hablaba Bourdain».

Neville es un documentalista aclamado que también dirigió el retrato de Fred Rogers «Won’t You Be My Neighbor?» y la ganadora del Oscar «20 Feet From Stardom». Comenzó a hacer su última película en 2019, más de un año después de la muerte por suicidio de Bourdain en junio de 2018.

Regístrese para recibir boletines informativos diarios

Copyright © 2021 The Washington Times, LLC.

Salir de la versión móvil