OpenAI ha presentado Voice Engine, un nuevo modelo de Inteligencia Artificial (IA) capaz de clonar la voz de las personas con una muestra de audio de 15 segundos, así como de leer indicaciones de texto con dicha voz en varios idiomas, con resultados naturales.
La compañía tecnológica estadounidense continúa desarrollando nuevas herramientas y modelos de IA de cara a proseguir con su compromiso de “comprender la frontera técnica y compartir abiertamente lo que es posible con la IA”, en este caso, en el campo de las voces sintéticas.
En este sentido, OpenAI ha dado a conocer Voice Engine, un modelo de IA diseñado para crear voces personalizadas utilizando entrada de texto y una única muestra de audio de 15 segundos para “generar un habla con sonido natural que se parece mucho al hablante original”.
Tal y como ha explicado la compañía en un comunicado en su web, comenzaron a desarrollar este modelo a finales de 2022 y, por el momento, Voice Engine es un modelo a pequeña escala que han utilizado para potenciar las voces preestablecidas disponibles en la API de conversión de texto a voz, así como en ChatGPT Voice y Read Aloud.
Sin embargo, al mismo tiempo, también han desarrollado este nuevo modelo con un enfoque de investigación, para comprender mejor los usos potenciales de esta tecnología. Para ello, lanzaron una vista previa a la que han tenido acceso a algunos socios “de confianza”.
Como resultado de esta vista previa, OpenAI ha destacado que, actualmente, Voice Engine es capaz de crear voces “emotivas y realistas” con una sola muestra de 15 segundos de audio de la voz original del hablante, a pesar de que se trata de un modelo pequeño.
Fuente: lanación.com.ar
Seguritech participa en Expo Seguridad México 2026 con una muestra de desarrollos tecnológicos que reflejan…
Durante décadas, asistir a un Mundial significaba guardar un boleto físico como un tesoro. Hoy,…
Woody, Buzz Lightyear y el resto de la pandilla están de regreso, pero esta vez…
Las redes profesionales se han convertido en una herramienta estratégica para quienes ocupan posiciones de…
La escena parece sacada de una película futurista. Un brazo robótico toma ingredientes, los cocina…
El consumo de eventos deportivos en México experimenta un cambio estructural. Ir al estadio ya…