IA

Veo 3, el generador de video con IA más potente

Google presentó recientemente Veo 3, su modelo más avanzado de generación de video con inteligencia artificial, capaz de producir clips de hasta ocho segundos con resolución de 720p.

Esta tecnología permite integrar efectos de sonido y diálogos sincronizados, lo que marca un avance significativo en las herramientas audiovisuales basadas en IA.

El modelo Veo 3 genera contenido mediante descripciones textuales o imágenes fijas, utilizando un modelo de difusión que transforma ruido aleatorio en escenas coherentes. El sistema incluye varios componentes: un modelo de lenguaje para interpretar instrucciones, un generador de video y otro de sonido.

Red neuronal

Durante su entrenamiento, se aplicó un proceso en el cual se añadía ruido a videos reales para que la red neuronal aprendiera a reconstruirlos paso a paso.

DeepMind, desarrollador del modelo, no reveló las fuentes exactas utilizadas para el entrenamiento, aunque se considera probable el uso de contenido de YouTube. Para mitigar riesgos, se emplea SynthID, una tecnología que incrusta marcas de agua invisibles en cada cuadro, las cuales persisten incluso tras compresión o edición del video.

Además del modelo Veo 3, Google lanzó Flow, una plataforma web para crear películas mediante IA. Flow permite a los usuarios controlar personajes, escenas y estilos visuales combinando Veo 3, Imagen 4 y el modelo de lenguaje Gemini. Estas herramientas están disponibles para suscriptores de Google AI Ultra, un plan que cuesta 250 dólares mensuales e incluye 12,500 créditos.

Cada generación de video consume 150 créditos, permitiendo hasta 83 clips por suscripción. Créditos adicionales pueden comprarse por un centavo cada uno, en bloques de 25, 50 o 200 dólares. Los tiempos de generación oscilan entre tres y cinco minutos por video, dependiendo de la complejidad del contenido solicitado.

Durante las pruebas, se observaron algunas limitaciones técnicas, como errores en la sincronización de diálogos y distorsión en subtítulos. Google aplica filtros para bloquear instrucciones que incluyan violencia, contenido sexual, marcas registradas o nombres de figuras públicas, lo cual restringe ciertos tipos de resultados.

Silvia Chavela

Entradas recientes

Open Finance, nueva estructura del sector financiero: Alexis Nickin Gaxiola

Imagina que tus datos financieros, en lugar de quedarse guardados en un solo banco, pudieran…

13 horas hace

Modernización de transporte urbano deberá integrar datos y tecnología: Alfredo Del Mazo Maza

Alfredo Del Mazo Maza, especialista en políticas públicas, afirmó que México avanza en la modernización…

18 horas hace

Tecnología para vigilar mares en Baja California Sur

La seguridad marítima en México ya no depende únicamente de barcos patrulleros o radares tradicionales.…

23 horas hace

Mercado Play conquista Smart TVs en Latinoamérica

El entretenimiento digital en América Latina sigue marcando récords con propuestas que conectan directamente con…

23 horas hace

Elektra impulsa la movilidad inteligente y transforma los traslados urbanos

En las grandes ciudades, el tráfico es un reto diario que impacta la productividad y…

2 días hace

Yo vivo Samsung: tecnología que acompaña cada momento

La campaña más reciente de Samsung Argentina propone una mirada distinta sobre la relación entre…

2 días hace