Los generadores de imágenes con IA fueron tendencia en 2023, pero ahora las empresas están enfocándose en la siguiente frontera: la generación de videos con IA. En febrero de 2024, OpenAI lanzó su generador de texto a video con IA, Sora, y no pasó mucho tiempo antes de que Google hiciera lo mismo.
El martes, durante su conferencia anual de desarrolladores Google I/O, Google presentó Veo, su generador de texto a video más avanzado, capaz de crear videos en resolución 1080p de más de un minuto de duración.
Además de ofrecer videos de alta calidad, Google afirma que Veo proporciona a los usuarios un «nivel de control creativo sin precedentes». Gracias a su comprensión avanzada del lenguaje natural, Veo puede interpretar indicaciones más detalladas y comprender términos cinematográficos como «timelapse» o «tomas aéreas».
En la misma conferencia, se anunciaron otros productos como Gemini, Search, Android 15 y más.
El generador de video de Google también aborda un problema común en la generación de videos: la fluidez de las tomas. Según Google, Veo puede crear imágenes coherentes, donde diferentes sujetos, como personas, animales y objetos, se mueven de manera realista en las escenas.
Google no es nuevo en la generación de videos. La compañía destacó que este modelo se basa en todos sus proyectos anteriores de generación de videos, incluidos Imagen-Video, VideoPoet y Lumiere.
A pesar de las similitudes con Sora de OpenAI, Veo de Google aún no está disponible para el público. Actualmente, Google lo comparte con creadores seleccionados en una vista previa privada dentro de VideoFX y ha abierto una lista de espera para que más personas puedan probar el modelo en el futuro.
Adicionalmente, Google presentó Imagen 3, su modelo de conversión de texto a imagen más avanzado hasta la fecha. Imagen 3, que ofrece una calidad de imagen mejorada y menos artefactos visuales, también está limitado a una vista previa privada dentro de ImageFX para creadores seleccionados, con su propia lista de espera.