IA

Veo 3, el generador de video con IA más potente

Google presentó recientemente Veo 3, su modelo más avanzado de generación de video con inteligencia artificial, capaz de producir clips de hasta ocho segundos con resolución de 720p.

Esta tecnología permite integrar efectos de sonido y diálogos sincronizados, lo que marca un avance significativo en las herramientas audiovisuales basadas en IA.

El modelo Veo 3 genera contenido mediante descripciones textuales o imágenes fijas, utilizando un modelo de difusión que transforma ruido aleatorio en escenas coherentes. El sistema incluye varios componentes: un modelo de lenguaje para interpretar instrucciones, un generador de video y otro de sonido.

Red neuronal

Durante su entrenamiento, se aplicó un proceso en el cual se añadía ruido a videos reales para que la red neuronal aprendiera a reconstruirlos paso a paso.

DeepMind, desarrollador del modelo, no reveló las fuentes exactas utilizadas para el entrenamiento, aunque se considera probable el uso de contenido de YouTube. Para mitigar riesgos, se emplea SynthID, una tecnología que incrusta marcas de agua invisibles en cada cuadro, las cuales persisten incluso tras compresión o edición del video.

Además del modelo Veo 3, Google lanzó Flow, una plataforma web para crear películas mediante IA. Flow permite a los usuarios controlar personajes, escenas y estilos visuales combinando Veo 3, Imagen 4 y el modelo de lenguaje Gemini. Estas herramientas están disponibles para suscriptores de Google AI Ultra, un plan que cuesta 250 dólares mensuales e incluye 12,500 créditos.

Cada generación de video consume 150 créditos, permitiendo hasta 83 clips por suscripción. Créditos adicionales pueden comprarse por un centavo cada uno, en bloques de 25, 50 o 200 dólares. Los tiempos de generación oscilan entre tres y cinco minutos por video, dependiendo de la complejidad del contenido solicitado.

Durante las pruebas, se observaron algunas limitaciones técnicas, como errores en la sincronización de diálogos y distorsión en subtítulos. Google aplica filtros para bloquear instrucciones que incluyan violencia, contenido sexual, marcas registradas o nombres de figuras públicas, lo cual restringe ciertos tipos de resultados.

Silvia Chavela

Entradas recientes

Norman Hagemeister transforma Georgia James con alta cocina sensorial

Georgia James, el legendario steakhouse texano ubicado en el distrito de Montrose en Houston, entra…

6 horas hace

Crean sangre artificial en polvo para emergencias

Un equipo de científicos de la Universidad de Maryland ha creado un tipo de sangre…

12 horas hace

Bari Ristorante redefine la hospitalidad bajo visión de Norman Hagemeister

Norman Hagemeister, reconocido por su enfoque en la innovación financiera y el impacto social, ha…

1 día hace

IA reconstruye textos antiguos incompletos

Aeneas, una nueva herramienta basada en inteligencia artificial (IA), predice las partes que faltan en…

2 días hace

Logran ver el interior del Volcán Popocatépetl con IA

Un grupo de científicos mexicanos logró “ver” el interior del volcán Popocatépetl mediante un innovador…

2 días hace

Tec busca transformar el futuro de la educación global

El Institute for the Future of Education (IFE) del Tec de Monterrey presentó reporte en…

2 días hace