Veo 3.1 ya genera vídeos verticales listos para YouTube Shorts y TikTok

Última actualización: 15 enero, 2026
  • Veo 3.1 incorpora generación nativa en formato vertical 9:16 pensada para YouTube Shorts, TikTok e Instagram Reels.
  • La función Ingredientes a vídeo permite convertir una o varias fotos en clips verticales más expresivos y coherentes.
  • El modelo mejora la consistencia de personajes, fondos y objetos, y añade escalado a 1080p y 4K.
  • Las nuevas funciones se integran en Gemini, YouTube Shorts, YouTube Create, Flow, Vertex AI y Google Vids.

IA generadora de vídeos verticales para redes sociales

Google ha dado un paso más en su apuesta por el vídeo generado por inteligencia artificial con Veo 3.1, una actualización que ataca de frente uno de los grandes retos de los creadores: adaptar el contenido al formato móvil sin perder calidad. La compañía incorpora por fin soporte nativo para vídeos verticales, alineándose con el consumo masivo de clips cortos en plataformas como YouTube Shorts, TikTok e Instagram.

Con esta versión, el modelo no solo mejora la calidad visual, sino que refuerza su enfoque en el teléfono como dispositivo principal. La herramienta “Ingredientes a vídeo” (o Ingredients to Video), que combina imágenes con un texto breve para generar clips, se convierte en el eje de la experiencia móvil y permite crear piezas listas para compartirse sin pasar por editores externos ni sacrificar encuadre.

Formato vertical nativo para Shorts, TikTok e Instagram

La novedad más llamativa es que Veo 3.1 ya genera vídeos en relación de aspecto 9:16 de forma nativa. Es decir, el modelo entiende desde el inicio que está trabajando en un lienzo vertical y compone la escena pensando en la pantalla del móvil, evitando el clásico recorte de un vídeo panorámico para encajarlo en vertical.

Según explica Google, esta actualización permite producir narrativas verticales a pantalla completa que se reproducen en YouTube Shorts, Reels de Instagram o TikTok sin bandas negras ni pérdidas de detalle. La IA sitúa mejor a los personajes y objetos dentro del encuadre, lo que reduce problemas habituales como sujetos cortados o escenas mal equilibradas al adaptarlas a móvil.

Hasta ahora, quienes utilizaban Veo para crear contenido corto tenían que recurrir a apps de terceros para transformar el vídeo en vertical, con el consiguiente trabajo extra y riesgo de degradar la imagen. Con el nuevo soporte 9:16, la exportación vertical se convierte en una opción directa tanto para creadores independientes como para equipos de marketing que trabajan con calendarios de publicación ajustados.

Esta orientación clara a la experiencia móvil responde al dominio actual del vídeo vertical en redes sociales, donde el desplazamiento desde el móvil marca el ritmo de consumo. La integración con plataformas de Google refuerza esa estrategia y facilita que el contenido generado no se quede en pruebas, sino que salte de forma natural al circuito social.

De fotos a clips verticales: así funciona Ingredientes a vídeo

La pieza clave de la actualización es la ampliación de capacidades de Ingredientes a vídeo, la función que permite convertir una o varias imágenes en clips de vídeo mediante un prompt corto. Esta herramienta, pensada desde el principio para facilitar el trabajo en el móvil, ahora admite también la generación directa en formato vertical.

El proceso es relativamente sencillo: el usuario selecciona las fotos que quiere usar como referencia (por ejemplo, un producto, un personaje o una escena) y escribe unas pocas líneas de indicaciones. A partir de ahí, Veo 3.1 combina esas “imágenes de ingredientes” con el texto para crear un clip en 9:16, ajustando encuadre, movimiento y estilo al resultado que se busca.

Google señala que, con la nueva versión, los vídeos obtenidos son más expresivos y creativos incluso con instrucciones simples. Los personajes muestran gestos y movimientos más naturales, los diálogos y las pequeñas narrativas ganan en riqueza, y los cambios entre escenas se perciben menos bruscos, algo relevante para contenido destinado a competir por la atención en el feed vertical.

Otra mejora importante es la capacidad de mezclar elementos visuales muy distintos —como estilos, texturas o fondos variados— dentro de un mismo clip sin que parezca un collage improvisado. La función de síntesis visual integra esas referencias en un vídeo cohesionado, siempre que las instrucciones del usuario sean claras respecto al tono y al estilo predominante.

Para quien crea contenido rápido para redes, esto abre la puerta a reutilizar fotos de un carrete, un catálogo o una campaña previa y transformarlas en pequeños vídeos verticales sin necesidad de rodajes adicionales, algo especialmente interesante para pequeñas marcas y creadores que trabajan con recursos limitados.

Más coherencia de personajes, fondos y objetos

Además del salto al formato vertical, Google ha afinado la coherencia visual del modelo, uno de los puntos débiles habituales en la generación de vídeo por IA. Veo 3.1 mejora la forma en la que mantiene el aspecto de los personajes, así como la continuidad de objetos y escenarios a lo largo de todo el clip.

Esto significa que, si en las imágenes de referencia aparece un personaje con rasgos concretos —ropa, peinado, accesorios—, la IA se esfuerza por conservar esa identidad aunque cambie de escenario. La misma lógica se aplica a fondos y objetos, que mantienen estilo, iluminación y tono coherentes para evitar saltos visuales que distraigan.

Google describe esta mejora como un avance en la coherencia de identidad: menos deformaciones inesperadas, menos transiciones raras entre planos y un aspecto general más estable. Para vídeos cortos que buscan contar una microhistoria en pocos segundos, esta estabilidad ayuda a que el resultado se perciba menos como un experimento de laboratorio y más como un contenido listo para publicación.

La capacidad de combinar varios personajes, decorados y texturas dentro de una misma pieza también se ha reforzado. El modelo ajusta valores como tono de color, iluminación o silueta para que las diferentes referencias encajen mejor, lo que facilita construir clips donde conviven imágenes muy diversas sin romper la sensación de unidad.

En la práctica, esto puede ser útil, por ejemplo, para campañas donde se mezclan imágenes reales de un producto con fondos estilizados o ilustraciones, manteniendo una estética uniforme que resulte reconocible para la audiencia.

Resolución 1080p y 4K con escalado de última generación

Junto al formato vertical, otra pata clave de la actualización es la mejora de la calidad de salida. Veo 3.1 incorpora un sistema de escalado avanzado que permite generar vídeos en 1080p y hasta 4K, cubriendo desde las necesidades de redes sociales hasta producciones más exigentes.

La compañía apunta que los clips en 1080p se benefician de una imagen más nítida y limpia, pensada para edición posterior o publicación directa en plataformas de consumo masivo. Para quienes requieren un nivel adicional de detalle —por ejemplo, en pantallas grandes o proyectos corporativos—, la opción 4K utiliza técnicas de escalado de última generación para conservar texturas y contornos.

Estas mejoras de resolución se orientan tanto al creador independiente que quiere que sus Shorts o Reels se vean bien en cualquier dispositivo, como a equipos profesionales que usan la IA como parte de un flujo de trabajo más amplio, en el que el vídeo generado se integra con grafismos, locuciones o grabaciones reales.

Google ofrece estas opciones de alta calidad a través de servicios orientados a empresas y desarrolladores, como Flow, la API de Gemini, Vertex AI y Google Vids, lo que facilita integrar Veo en procesos de producción más complejos, desde agencias hasta departamentos de comunicación interna.

La apuesta por resoluciones elevadas encaja con el objetivo de que el contenido generado no quede relegado a pruebas internas, sino que pueda utilizarse en contextos públicos exigentes, desde campañas en redes hasta piezas que terminen proyectadas en eventos o presentaciones.

Disponibilidad: Gemini, YouTube Shorts y el ecosistema de Google

Las nuevas funciones de Veo 3.1 se están desplegando de forma escalonada en el ecosistema de Google. En el terreno del consumo general, la función de convertir fotos en clips verticales está disponible en la app de Gemini para móviles, donde los usuarios pueden elegir Veo 3.1 como modelo activo y trabajar directamente desde el chat.

Además, Google ha integrado la experiencia con sus herramientas de vídeo social: YouTube Shorts y la app YouTube Create ya permiten aprovechar las mejoras del modelo, de modo que la generación y edición rápida de contenido vertical se concentran en un mismo entorno. Esto facilita que las piezas creadas con IA se ajusten mejor a los flujos habituales de publicación en YouTube.

Para usuarios avanzados y empresas, las capacidades ampliadas de Veo 3.1 se incorporan también a Flow, la API de Gemini, Vertex AI y Google Vids. En estos servicios se encuentran las opciones de salida en 1080p y 4K, pensadas para quienes integran la IA en herramientas internas, aplicaciones de terceros o soluciones corporativas.

En la práctica, un creador puede experimentar con clips rápidos en Gemini o YouTube Create y, más adelante, escalar a flujos más complejos en Vertex AI o Google Vids sin cambiar de tecnología base.

La compañía no ha centrado la comunicación en un territorio concreto, pero estas funciones se orientan también al mercado europeo, donde el consumo de vídeo corto en móvil sigue en crecimiento y el uso de herramientas en la nube de Google —tanto para empresas como para educación— está ampliamente extendido.

Etiquetado de contenidos y uso responsable de la IA

En paralelo a las nuevas capacidades, Google ha subrayado la importancia de identificar de forma clara qué vídeos han sido generados con IA. Con esta actualización, los clips creados con Veo 3.1 incorporan una marca de agua SynthID, invisible para el usuario, pensada para indicar que se trata de contenido sintético.

Esta etiqueta puede verificarse a través de la app de Gemini y se enmarca en los esfuerzos de la compañía por combatir la desinformación, un punto especialmente sensible en Europa, donde los reguladores vigilan de cerca el uso de IA generativa en contenido audiovisual. La idea es que plataformas, medios y usuarios puedan identificar cuándo un vídeo proviene de un modelo como Veo.

El etiquetado no afecta a la experiencia visual, pero sí añade una transparencia que podría convertirse en requisito en distintos ámbitos, desde campañas institucionales hasta comunicación corporativa. De este modo, Google busca adelantarse a posibles exigencias regulatorias y ofrecer garantías a creadores y empresas que trabajan con su tecnología.

Este enfoque encaja con la tendencia general del sector, en la que los grandes modelos de generación de imagen y vídeo incorporan sistemas similares para diferenciar contenido real y sintético, especialmente en contextos donde la confianza del público es clave.

Para quienes usan Veo 3.1 en proyectos profesionales, esta marca de agua puede interpretarse como un sello que deja claro el origen del contenido sin restar capacidad creativa, algo relevante en campañas que combinan material grabado y generado.

Con la llegada del formato vertical nativo, la mejora de la coherencia visual y la posibilidad de escalar hasta 4K, Veo 3.1 se posiciona como una herramienta pensada para el día a día de los creadores de Shorts, Reels y TikToks, pero también para equipos que buscan automatizar parte de su producción audiovisual. La combinación de integración profunda en el ecosistema de Google y etiquetado transparente de los contenidos refuerza el papel de este modelo en un panorama donde el vídeo para móvil manda y la inteligencia artificial se cuela cada vez más en todas las fases del proceso creativo.

Vídeo de TikTok.
Related article:
Las mejores apps para crear vídeos de TikTok a partir de vídeos largos: Guía completa y actualizada