Noticias

Voice Engine puede clonar tu voz con 15 segundos de audio

OpenAI ha presentado Voice Engine, un nuevo modelo de Inteligencia Artificial (IA) capaz de clonar la voz de las personas con una muestra de audio de 15 segundos, así como de leer indicaciones de texto con dicha voz en varios idiomas, con resultados naturales.

La compañía tecnológica estadounidense continúa desarrollando nuevas herramientas y modelos de IA de cara a proseguir con su compromiso de “comprender la frontera técnica y compartir abiertamente lo que es posible con la IA”, en este caso, en el campo de las voces sintéticas.

En este sentido, OpenAI ha dado a conocer Voice Engine, un modelo de IA diseñado para crear voces personalizadas utilizando entrada de texto y una única muestra de audio de 15 segundos para “generar un habla con sonido natural que se parece mucho al hablante original”.

Voice Engine

Tal y como ha explicado la compañía en un comunicado en su web, comenzaron a desarrollar este modelo a finales de 2022 y, por el momento, Voice Engine es un modelo a pequeña escala que han utilizado para potenciar las voces preestablecidas disponibles en la API de conversión de texto a voz, así como en ChatGPT Voice y Read Aloud.

Sin embargo, al mismo tiempo, también han desarrollado este nuevo modelo con un enfoque de investigación, para comprender mejor los usos potenciales de esta tecnología. Para ello, lanzaron una vista previa a la que han tenido acceso a algunos socios “de confianza”.

Como resultado de esta vista previa, OpenAI ha destacado que, actualmente, Voice Engine es capaz de crear voces “emotivas y realistas” con una sola muestra de 15 segundos de audio de la voz original del hablante, a pesar de que se trata de un modelo pequeño.

Fuente: lanación.com.ar

Silvia Chavela

Entradas recientes

Acciones de tecnología de red avanzan pese a temores de burbuja en IA

El mercado bursátil en Estados Unidos mantiene el foco en las acciones de tecnología de…

3 horas hace

Tecnología ayuda a gobiernos a operar con enfoque empresarial

Los gobiernos en Estados Unidos están replanteando la forma en que administran su infraestructura digital…

3 horas hace

Nueva tecnología háptica permite ver y sentir gráficos 3D

Investigadores de la Universidad de California en Santa Bárbara (UCSB) desarrollaron una pantalla háptica 3D…

3 horas hace

Australia aplica tecnología para bloquear a menores en redes sociales

Australia dio un paso inédito en regulación digital al poner en marcha tecnología obligatoria para…

3 horas hace

La NFL redefine estándares de seguridad

La NFL avanza en Estados Unidos hacia un nuevo modelo de seguridad para sus jugadores…

4 horas hace

Empresas reinvierten productividad generada por IA

La inteligencia artificial dejó de ser una promesa para convertirse en una palanca real de…

4 horas hace