La herramienta de traducción impulsada por IA de Spotify hace que los podcasters hablen en lenguas globales

spotify nueva ia por Francisco Perez Yoma


Spotify está abriendo mercados de idiomas extranjeros a sus podcasters a través de inteligencia artificial.

La compañía anunció el lunes un programa piloto llamado Traducción de Voz para podcasts que no sólo traduce un podcast de un idioma a otro sino que retendrá la voz del podcaster mientras lo hace.

La nueva herramienta de traducción de Spotify, que utiliza la tecnología de generación de voz de OpenAI, puede clonar las características de voz de un hablante para hacer que una traducción suene más natural.

El programa piloto contará con podcasts selectos de Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons y Steven Bartlett, traducidos al español, francés y alemán.

En el futuro, Spotify también planea traducir episodios de “eff won with DRS” de Dax Shepard, “The Rewatchables” de The Ringer y el nuevo podcast original de Trevor Noah que se lanzará a finales de este año.

"Al igualar la propia voz del creador, Voice Translation brinda a los oyentes de todo el mundo el poder de descubrir e inspirarte en nuevos podcasters de una manera más auténtica que nunca", dijo el vicepresidente de personalización de Spotify, Ziad Sultan, en un comunicado.

"Creemos que un enfoque reflexivo de la IA puede ayudar a construir conexiones más profundas entre oyentes y creadores, un componente clave de la misión de Spotify de liberar el potencial de la creatividad humana", añadió.

Beneficios para podcasters y Spotify

La nueva herramienta de traducción tiene el potencial de ser beneficiosa tanto para los podcasters como para Spotify. "La propuesta de Spotify podría ampliar el alcance de la audiencia de estos podcasts a nuevas audiencias y países", dijo Greg Sterling, cofundador de Near Media , un sitio web de noticias, comentarios y análisis.

"Esto beneficia potencialmente tanto a Spotify como al podcaster al ampliar el alcance de la audiencia", mencionó.

Los podcasts en inglés traducidos al mandarín y al hindi tendrían acceso a algunos mercados muy grandes a los que no tendrían acceso si el podcaster no hablara esos idiomas, añadió Rowan Curran, analista de Forrester Research, una empresa nacional de investigación de mercados con sede en Cambridge . Masa.

"Esto representa una democratización de las capacidades de la IA del lenguaje". "Esto sigue el patrón de los últimos años en los que estas funcionalidades realmente avanzadas están disponibles para un conjunto muy amplio de personas".

Rob Enderle, presidente y analista principal de Enderle Group , una firma de servicios de asesoría en Bend, Oregon, señaló que los podcasters no sólo aumentarán su audiencia sino también sus billeteras, ya que cuanto más oídos capten sus podcasts, más mayores serán los ingresos potenciales que pueden generar.

Lo mismo ocurre con Spotify. “Cada artista puede generar más ingresos; Los de alto rendimiento harán que la empresa gane mucho más dinero”, dijo a TechNewsWorld.

Presión para que las inversiones valgan la pena Ashu Dubey, cofundador y director ejecutivo de Gleen , una empresa de inteligencia artificial generativa en Pleasanton, California, estuvo de acuerdo en que la herramienta de traducción podría tener un impacto positivo en los resultados de Spotify.

"Si hay un podcast de alta demanda que sólo está grabado en inglés, entonces esta tecnología podría exponer ese programa a audiencias en Japón o Francia, por ejemplo, y ayudar a Spotify a vender más suscripciones en esos países”.

Spotify realmente necesita vender más suscripciones, sostuvo Todd Cochrane, director ejecutivo de Blubrry Podcasting , un servicio de alojamiento y distribución de podcasts en Traverse City, Michigan.

"Necesitan un mayor número de oyentes para monetizar, ya que están bajo una presión extrema para que sus inversiones de miles de millones de dólares recuperen el dinero que han perdido".

Spotify ha hecho algunos acuerdos de alto perfil en los últimos años, incluido un pacto exclusivo de varios años por 200 millones de dólares con el podcaster Joe Rogan, 196 millones de dólares para el sitio de deportes y cultura pop Ringer y 56 millones de dólares para la productora Parcast, conocida por su podcasts sobre crímenes reales.

Si bien Spotify está ahora a la cabeza con su herramienta de traducción, su ventaja podría esfumarse rápidamente. "Esta no será solo la tecnología de Spotify", advirtió Curran, "Spotify es la primera gran plataforma de creadores en hacer esto, pero pasará poco tiempo hasta que veamos esto en plataformas como YouTube".

Tecnología potencialmente peligrosa

A pesar de los beneficios de la nueva herramienta de traducción de Spotify, su tecnología subyacente también tiene un lado oscuro.

"La tecnología puede ser bastante peligrosa y potencialmente explotadora", dijo Sterling. “Ya se está utilizando en fraudes y estafas. Y ya se están produciendo usos no autorizados de clones de voces de celebridades en grabaciones de audiolibros”.

"Debe usarse con precaución y en todos los casos con el permiso del sujeto", continuó. “Pero el desequilibrio de poder entre las plataformas y las personas que las utilizan puede no generar casos de uso equitativos de la IA de voz. Es necesario que existan pautas éticas claras”.

“Este es uno de los temas de la huelga de actores aún no resuelta. ¿Tienen los estudios derecho a explotar la voz y la imagen de un actor a perpetuidad sin permiso? añadió.

Dubey señaló que la herramienta de traducción podría estar sujeta a esa pesadilla de las aplicaciones de IA: las alucinaciones.

"Esto podría suceder si el podcaster usara una frase que realmente no tuviera una frase equivalente en el idioma que se está traduciendo", explicó.

"Por ejemplo", continuó, "el término alemán schadenfreude realmente no tiene una traducción estricta en la mayoría de los idiomas, por lo que una IA que se base únicamente en un modelo de lenguaje grande podría terminar alucinando la traducción y poniendo palabras en el boca de los podcasters”.

La clave de ejecución para el éxito

Las traducciones también podrían crear problemas legales para los podcasters.

"Si la tecnología de inteligencia artificial no proporciona una traducción precisa del contenido de un creador de podcasts, el creador de podcasts podría enfrentar consecuencias legales, como difamación o violaciones de la FTC", señaló Alyssa J Devine, directora ejecutiva y fundadora de Purple Fox Legal, una firma de abogados con un enfoque en la ley de propiedad intelectual para emprendedores y creativos, en Nashville, Tennessee.

"La jurisdicción y el lugar apropiados para tales reclamos dependerían de los hechos de una situación específica, pero no es raro que un demandante en un país obtenga una sentencia contra un demandado en otro condado", dijo a TechNewsWorld.

La ejecución será la clave del éxito de la traducción de voz, sostuvo Cochrane.

"Si Spotify no lo hace bien, podría hacer lo contrario y dañar todo el contenido de los podcasts en la plataforma y desviar el contenido de los oyentes nativos que no hablan inglés", dijo. "Es un riesgo real si suena sintético y sin inflexiones."

Mark N. Vena, presidente y analista principal de SmartTech Research en San José, California, y también presentador de podcasts, explicó que traducir podcasts puede ser un desafío.

"Cuando se traducen cosas a diferentes idiomas, todo lo que se dice en un idioma no se puede traducir claramente a otro", dijo.

"Si la precisión de la traducción no es muy buena, será un problema", continuó. "También habrá un problema al limpiar algunos de los artefactos de un podcast: los ums y ahs y los espacios incómodos".

"Soy muy escéptico sobre cuán efectivo será esto", afirmó.

Traducido y Adaptado de TechNewsWorld

Fuente: este post proviene de Francisco Pérez Yoma, donde puedes consultar el contenido original.
¿Vulnera este post tus derechos? Pincha aquí.
Creado:
¿Qué te ha parecido esta idea?

Esta idea proviene de:

Y estas son sus últimas ideas publicadas:

Blockchain es un libro de contabilidad compartido e inmutable que facilita el proceso de registrar transacciones y rastrear activos en una red empresarial. ¿Por qué es importante la Blockchain?Los neg ...

Etiquetas:

Recomendamos

Relacionado

marketing podcast

El podcasting es la distribución de archivos de audio bajo demanda, conocidos como podcasts. La idea surgió en 2004, para que las estaciones de radio pudieran transmitir su contenido en diferido. Pero pronto se hicieron muy populares, precisamente porque permiten ser escuchados cuando al usuario le apetezca. Además, se puede suscribirse para verlos en streaming o descargar para reservar y escuchar ...

Tecnología e Internet

La importancia de los asistentes virtuales en nuestro día a día va creciendo. Es cierto que todavía no han llegado a conseguir su punto óptimo de maduración, pero lo que también es verdad es que los desarrolladores se están esforzando (y mucho) en conseguir que cada vez existan más y mejores opciones para integrarlos en nuestra vida. En este sentido, aparece ahora una nueva opción en el asistente ...

Tecnología e Internet

The Beatles vuelven juntos por obra y gracia de la IA Los avances en clonación de voz mediante IA han sido monumentales en el último año; al punto que no solo es posible crear copias convincentes de las voces de personas famosas, sino también ponerlas a trabajar para componer canciones coherentes. En este orden de ideas, parece que el mítico grupo The Beatles todavía tiene muchos fans alrededor de ...

actualizaciones smartphone tecnología

¿Qué es un asistente virtual? Un asistente virtual, como su nombre indica, se refiere a alguien que realiza tareas administrativas como programar reuniones, programar citas, administrar los recados personales del día a día, etc., de manera virtual. Un asistente virtual basado en inteligencia artificial se denomina asistente de inteligencia artificial, asistente personal, asistente de voz o asisten ...

Ciencia Curiosidades Estudios ...

Hemos platicado en múltiples ocasiones de los grandes avances en materia de Inteligencia Artificial (IA), pero también hemos comentado en este mismo espacio respecto a las grandes dudas respecto a su incursión en la vida de los humanos. En este sentido, Google es quizá la empresa que más ha apostado por el desarrollo de IA y durante su evento I/O para desarrolladores presentó un nuevo sistema a ...

Tecnología e Internet

Como sabrán, la conferencia de desarrolladores de Facebook F8 ha tomado lugar en California y ayer te contábamos sobre los cambios y novedades que están por llegar a las redes sociales de Facebook, entre ellas Instagram y WhatsApp. El día hoy te traemos el resumen del segundo día de la conferencia, el cual se enfoca en inversiones a largo en plazo en Inteligencia artificial, realidad virtual y aum ...

ChatGPT se acerca cada vez más a la paridad de funciones con el seductor asistente de inteligencia artificial de Her , gracias a una actualización que agrega reconocimiento de voz e imagen al chatbot. OPEN.AI La compañía de inteligencia que lanzó ChatGPT en el mundo en noviembre pasado está haciendo que la aplicación de chatbot sea mucho más comunicativa. Una actualización de las aplicaciones móvi ...

Plataformas Uncategorized monetizar ...

Como crear un podcast desde cero La popularidad de los podcast está en alza y además han aumentado las plataformas en las que se pueden escuchar por lo que llegan a más mercado aún como es el caso de Spotify. La ventaja que tiene crear un podcast ahora es que aún el mercado no está muy saturado, es relativamente fácil encontrar tu nicho sin problemas además las plataformas de creación y alojamient ...

Apple Music se queda atrás en la guerra del streaming musical con Spotify Apple Music se está quedando por detrás de Spotify en la guerra del streaming musical. No me malinterpreten, he estado usando Apple Music desde el día en que se lanzó en 2015, pero después de casi seis años de su lanzamiento, no creo que pueda defender a Apple por no corregir algunos defectos o añadir características que los ...

Tecnología Google Inteligencia Artificial

Google anunció un nuevo modelo de inteligencia artificial para búsqueda multimodal llamado MUM (modelo unificado multitarea) en su conferencia de desarrolladores Google anunció la firma de las nuevas funciones orientadas al consumidor, incluida la búsqueda visual. Actualmente Big G le ofrece información contextual, como fragmentos de Wikipedia, letras de canciones o videos de recetas en función de ...