OpenAI anuncia una nueva tecnología para clonar la voz a partir de un audio de 15 segundos

OpenAI ha presentado una innovadora herramienta llamada Voice Engine, capaz de clonar la voz de cualquier persona a partir de una muestra de audio de 15 segundos.

El motor de voz analiza una señal de audio corta y crea un habla natural con “voces emotivas y realistas”. Esta innovadora tecnología, basada en la actual API de síntesis de voz de OpenAI, puede ser útil para diversos fines: audiolibros, traducción de idiomas y ayuda a personas con trastornos del habla.

OpenAI reconoce los graves riesgos que conlleva el uso de esta tecnología, incluida la posibilidad de que personas sin escrúpulos hagan un uso indebido de ella. Por ello, la empresa trabaja activamente para garantizar la privacidad y la seguridad y ha puesto en marcha una serie de medidas, como la marca de agua y la supervisión proactiva del uso del sistema.

Según el anuncio, Voice Engine sigue en fase de preestreno, pero la empresa ya ha llevado a cabo con éxito programas piloto que demuestran el potencial de Voice Engine. Se celebró un preestreno en la Universidad de Brown, donde la función se utilizó para ayudar a pacientes con deficiencias del habla.

Según OpenAI, su motor de voz se implementará mientras se recogen las opiniones de los socios y se adhiere a una política que prohíbe el uso de voces clonadas sin el consentimiento de la persona. Además, está previsto crear una “lista de votos prohibidos” para evitar abusos.

El coste estimado del uso de Voice Engine es de aproximadamente 15 dólares por millón de caracteres, lo que equivale aproximadamente a 162.500 palabras.

Fuente gagadget
También podría gustarte
Comentarios
Loading...

Este sitio web utiliza cookies para mejorar su experiencia. Suponemos que está de acuerdo, pero puede darse de baja si lo desea. Acepte Seguir leyendo