¿Cómo usar la Inteligencia Artificial para traducir podcasts?


Alerta: contenido altamente parcial (no soy quién para mentirte). Esta es mi opinión completamente sesgada por mi experiencia aunque muy válida y fundamentada.

Hay historias que traspasan todo tipo de fronteras culturales por su impacto. Sin embargo, muchas aún no pueden ser accesibles para todo el mundo debido a la barrera idiomática… pero esto cambió hace un tiempo gracias a la traducción con inteligencia artificial y doblaje multilingüe.

Si te gustan estos temas y te gustaría recibir más información sobre el mundo de los podcasts, datos de cómo usar la inteligencia artificial en la creación de contenidos, suscríbete a nuestro newsletetter semanal “El Gramófono”.

🎧 Adaptaciones tradicionales con doblaje de voz

Caso 63 es el ejemplo perfecto. El podcast chileno Caso 63 alcanzó gran éxito en latinoamérica y fue adaptado al inglés como Case 63, con Julianne Moore y Oscar Isaac como protagonistas. Esta versión, lanzada en octubre de 2022, fue la primera adaptación de un original en español producida por Spotify (más tarde se adapto a otros idiomas), y alcanzó rápidamente el primer lugar en su categoría.

Este modelo sigue pasos clásicos: traducir el contenido (y adaptarlo si es necesario), contratación de actores de voz, doblaje profesional, interpretación localizada y una producción enfocada en la adaptación de la calidad narrativa.

Sin embargo, y pese a que los doblajes profesionales son increíbles, toman tiempo y dinero que, en el caso de producciones independientes, escasea. Es así como otras soluciones, vienen a emparejar un poco la cancha para todos.

🤖 Traducción instantánea y con clonación de voz por IA

Te he hablado más de una vez de ElevenLabs… de hecho creo que ya me excedí… y eso que no me pagan por promoción (aló colaboración?) pero es la plataforma que mejor conozco que puede lograr exactamente esto de lo que te voy a contar.

Hace unos años Spotify está probando una función llamada Voice Translation, que permite traducir podcasts en tiempo real replicando la voz original del creador gracias a IA y tecnología de OpenAI. Actualmente soporta inglés–español, con próximos lanzamientos en francés y alemán. El sistema utiliza el modelo Whisper para transcribir y traducir, y luego genera audio que suena como el locutor creando contenidos en el idioma de destino.

Pese que a todavía estamos en una fase piloto hay algunos creadores que son parte de este programa donde ya podemos escuchar sus podcasts en español gracias a esta función de Spotify:

  • The Diary of a CEO — originalmente en inglés, está siendo traducido a otros idiomas gracias a modelos TTS que conservan la voz del narrador.

  • Lex Fridman Podcast — también explorando traducción automática para acceder a nuevas audiencias.

En lo personal, creo que está bien hecho. Las voces en español suenan coherentes a las originales y pese a que a veces, se siente como estar escuchando un documental de Home&Health o una persona hablando español con un acento durísimo, ME GUSTA. Cumple el objetivo de transmitir el contenido de una manera cercana (y extrañamente lo hace de una manera en la que puedes percibir emociones, las entonaciones y flexiones de la voz).

🎥 Doblaje automático de videos en YouTube

YouTube (a través de Google) permite a los creadores doblar automáticamente sus videos usando IA, gracias a su integración con Aloud del proyecto Área 120. El proceso es sencillo: se genera una transcripción, se corrige y luego se elige el idioma de salida, produciendo un doblaje en ese idioma.

Quizá aquí me salgo un poco de la temática podcasts pero llevo unos meses viendo que cada vez más creadores están utilizando la modalidad de traducción automática de YouTube y que pese a que se agradece el gesto… aún queda mucho por avanzar para que estas voces se traduzcan íntegramente a otros idiomas sin perder el tono de voz del creador o creadora.

Y es que este último punto es importante, porque a diferencia de las películas donde actores y actrices están interpretando un personaje, por lo que (a mi parecer) no es fundamental que las voces del doblaje sean demasiado similares a la original… peeeero cuando estoy viendo a un creador/a de contenido, l@ estoy viendo a ella/él porque me gusta SU contenido, SU personalidad, SU humor o personalidad y por consiguiente, SU voz… Espero que YouTube pueda desarrollar más esta función para que al ver un video que orginalmente estaba en otro idioma ya no me provoque esta incomodidad.

🧭 Algunas conclusiones

El doblaje tradicional garantiza un render profesional y bien interpretado, pero es costoso y más lento. En contraste, las IA ofrecen una solución rápida, escalable y fiel, manteniendo la identidad vocal (en algunos casos). Con Spotify liderando en podcasts y YouTube en video (de mala manera por ahora según yo), estamos entrando en una era donde el contenido rompe las barreras del idioma casi automáticamente.

¿Quieres explorar cómo traducir tu podcast o aplicar clonación de voz en otro idioma? Puedo ayudarte a usar estas herramientas y en el proceso ayudarte con todo el proceso de producción, prueba nuestro nuevo servicio de asesorías de producción para podcasters, donde te ayudamos a ser un@ pro de los podcasts.

Pd: Si quiere leer más de inteligencia artificial, de voces clonadas y podcasts te dejo 3 artículos recomendados para interiorizarte en este tema:

Siguiente
Siguiente

Géneros de Podcasts: una guía completa con ejemplos