1. Home
  2. »
  3. Noticias
  4. »
  5. Voice Engine puede clonar tu voz con 15 segundos de audio

Voice Engine puede clonar tu voz con 15 segundos de audio

Facebook
Twitter
Pinterest

OpenAI ha presentado Voice Engine, un nuevo modelo de Inteligencia Artificial (IA) capaz de clonar la voz de las personas con una muestra de audio de 15 segundos, así como de leer indicaciones de texto con dicha voz en varios idiomas, con resultados naturales.

La compañía tecnológica estadounidense continúa desarrollando nuevas herramientas y modelos de IA de cara a proseguir con su compromiso de “comprender la frontera técnica y compartir abiertamente lo que es posible con la IA”, en este caso, en el campo de las voces sintéticas.

En este sentido, OpenAI ha dado a conocer Voice Engine, un modelo de IA diseñado para crear voces personalizadas utilizando entrada de texto y una única muestra de audio de 15 segundos para “generar un habla con sonido natural que se parece mucho al hablante original”.

Voice Engine

Tal y como ha explicado la compañía en un comunicado en su web, comenzaron a desarrollar este modelo a finales de 2022 y, por el momento, Voice Engine es un modelo a pequeña escala que han utilizado para potenciar las voces preestablecidas disponibles en la API de conversión de texto a voz, así como en ChatGPT Voice y Read Aloud.

Sin embargo, al mismo tiempo, también han desarrollado este nuevo modelo con un enfoque de investigación, para comprender mejor los usos potenciales de esta tecnología. Para ello, lanzaron una vista previa a la que han tenido acceso a algunos socios “de confianza”.

Como resultado de esta vista previa, OpenAI ha destacado que, actualmente, Voice Engine es capaz de crear voces “emotivas y realistas” con una sola muestra de 15 segundos de audio de la voz original del hablante, a pesar de que se trata de un modelo pequeño.

Fuente: lanación.com.ar

Noticias Relacionadas