Saltar al contenido

Google lanza Nano Banana 2 Lite: genera imágenes en 4 segundos y abre Gemini Omni Flash a desarrolladores

Nano Banana 2 Lite genera imágenes en 4 segundos por $0.034; Gemini Omni Flash edita video a $0.10 por segundo.

por Alejandro Castillo Leone
Google lanza Nano Banana 2 Lite: genera imágenes en 4 segundos y abre Gemini Omni Flash a desarrolladores
Photo by Shutter Speed / Unsplash

TL;DR:

  • Nano Banana 2 Lite (Gemini 3.1 Flash-Lite Image) genera imágenes en 4 segundos a $0.034 dólares por imagen en 1K, ya disponible en Google AI Studio, la API de Gemini y la Gemini Enterprise Agent Platform.
  • Gemini Omni Flash entra en vista previa pública para desarrolladores: genera y edita video con instrucciones en lenguaje natural a $0.10 por segundo, el mismo precio que Veo 3.1 Fast.
  • En el ranking independiente de Arena, Nano Banana 2 Lite queda en quinto lugar, detrás de GPT-Image-2 de OpenAI y MAI-Image-2.5 de Microsoft.

Google presentó este 30 de junio de 2026 dos modelos nuevos dentro de su familia Gemini: Nano Banana 2 Lite, un generador de imágenes pensado para velocidad y volumen, y Gemini Omni Flash, su modelo de generación y edición de video, que llega por primera vez a desarrolladores a través de la API. Nano Banana 2 Lite, identificado en el código como gemini-3.1-flash-lite-image, entrega una imagen en 4 segundos a $0.034 dólares por imagen en resolución 1K, y funciona como reemplazo directo del Nano Banana original (Gemini 2.5 Flash Image). Ambos modelos ya están disponibles en Google AI Studio, la API de Gemini y la Gemini Enterprise Agent Platform, justo cuando Google pelea de cerca con OpenAI y Microsoft por dominar la generación de imágenes con IA.

Nano Banana 2 Lite es el modelo de imágenes más rápido y económico que Google ha lanzado dentro de la familia Gemini, pensado para quien necesita producir miles de piezas sin que el presupuesto ni el tiempo de espera se disparen. Google resalta dos fortalezas concretas:

  • Latencia: resultados de texto a imagen en apenas 4 segundos, útiles para prototipado interactivo y bocetos visuales rápidos.
  • Costo: $0.034 dólares por imagen en resolución 1K, pensado para presupuestos operativos ajustados o flujos de bajo volumen de procesamiento.

A pesar de priorizar la velocidad, Google asegura que el modelo conserva fidelidad a las instrucciones, consistencia de personajes y texto legible dentro de la imagen. Eso sí, tiene un límite claro: solo genera en resolución 1K, mientras que Nano Banana 2 y Nano Banana Pro escalan hasta 2K y 4K.

Para desarrolladores, el modelo está disponible desde hoy en Google AI Studio, la API de Gemini y la Gemini Enterprise Agent Platform, esta última con soporte de rendimiento aprovisionado para absorber picos de solicitudes. Para el público general, llega de forma escalonada a AI Mode en Buscador, la app de Gemini, Google Fotos, Stitch, Google Flow y Google Ads.

El cambio más visible para el usuario común podría llegar por otra vía: NotebookLM. La herramienta de investigación de Google usará Nano Banana 2 Lite para generar Short Video Overviews, resúmenes verticales de 60 segundos con narración y animaciones educativas que, según reportó 9to5Google, se sumarán en las próximas semanas a los Cinematic Video Overviews que la plataforma ya ofrece.

Ai letters on a glowing orange and blue background
Photo by Zach M / Unsplash

Nano Banana 2 Lite supera a su antecesor, pero no lidera el mercado

Los números no mienten, pero tampoco cuentan toda la historia. Google compara el rendimiento de sus modelos con un sistema de puntaje Elo, el mismo método que se usa para rankear ajedrecistas, adaptado aquí a comparaciones cara a cara entre modelos de imagen. Según el conteo que reportó VentureBeat sobre las pruebas internas de la compañía, Nano Banana 2 Lite anotó 1251 puntos en generación de texto a imagen, por encima de los 1151 del Nano Banana original y, de forma inesperada, de los 1245 de Nano Banana Pro en ese mismo renglón. En edición de una sola imagen llegó a 1308 puntos; en edición de varias imágenes a la vez, a 1294.

Esas cifras salen de pruebas que la propia Google diseñó. La clasificación independiente cuenta otra historia: según datos de Neowin, en el ranking general de Arena para modelos de texto a imagen, Nano Banana 2 Lite ocupa el quinto lugar. El primer puesto sigue en manos de GPT-Image-2 de OpenAI, con 1388 puntos, mientras que MAI-Image-2.5 de Microsoft, presentado en mayo de 2026, se quedó con el cuarto.

La familia Nano Banana tiene ahora cuatro escalones, cada uno con un trabajo distinto:

  • Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image): velocidad ante todo, para flujos de alto volumen casi en tiempo real.
  • Nano Banana 2 (Gemini 3.1 Flash Image): el generalista, el mejor balance entre calidad y costo.
  • Nano Banana Pro (Gemini 3 Pro Image): para trabajos profesionales complejos, con el razonamiento y control más avanzados.
  • Nano Banana (Gemini 2.5 Flash Image): el modelo heredado que Google ya recomienda reemplazar.

Gemini Omni Flash lleva la edición conversacional al video

Google mostró Gemini Omni Flash por primera vez en su conferencia I/O 2026. Hoy, el modelo (gemini-omni-flash-preview) entra en vista previa pública en la API de Gemini y Google AI Studio, con generación nativa de audio en cada video que produce. El precio iguala al de Veo 3.1 Fast: $0.10 dólares por segundo de salida.

Google destaca cuatro fortalezas del modelo:

  • Edición conversacional: ajustar el video con instrucciones en lenguaje natural, sin pasar por un editor tradicional.
  • Referencias multimodales: combinar texto, imagen y video para mantener control y consistencia sobre una escena.
  • Conocimiento del mundo real: apoyarse en lo que Gemini sabe de historia, biología y lógica narrativa para construir videos coherentes.
  • Sincronización de texto y acción: conectar gráficos y texto directamente con los movimientos en pantalla.

Las limitaciones también son concretas. Por ahora genera clips de hasta 10 segundos, sin soporte todavía para referencias de audio ni extensión de escenas dentro de la API. El esquema técnico acepta referencias de video de hasta 3 segundos, pero Google admite que el modelo aún no las procesa de forma correcta. La consistencia de los personajes también pierde firmeza cuando la escena cambia o la cámara se mueve.

La apuesta real está en encadenar ambos modelos

Con la Interactions API, que conserva el historial de una sesión y permite encadenar hasta tres ediciones consecutivas, un desarrollador puede generar una imagen con Nano Banana 2 Lite y pasarla como referencia a Gemini Omni Flash para animarla. Google publicó tres aplicaciones de demostración para mostrar ese flujo: Anywhere, que transporta una selfie a paisajes icónicos y luego la convierte en clip; Space Lift, que reimagina una habitación a partir de una foto y genera un recorrido cinematográfico del nuevo diseño; y Omni Product Studio, que convierte fotos de producto en videos de comercio electrónico.

La adopción ya tiene nombres propios. En un anuncio paralelo, Google Cloud señaló que Adobe integrará ambos modelos a Firefly, su estudio de creación con IA, y que el gigante global de marketing WPP los sumó a su plataforma WPP Open para automatizar cambios de personajes y estilo en campañas publicitarias. La plataforma de diseño Figma usa Nano Banana 2 Lite dentro de su canvas Weave para acelerar la iteración de layouts, y el agente autónomo Manus AI lo aplica para generar piezas visuales en páginas web y presentaciones. Idan Yonas, director de contenido e innovación en IA de la plataforma de assets Artlist, lo resumió así: la generación ahora es más rápida que la propia idea, lo que permite a los creadores quedarse "dentro de la idea" en lugar de esperar una barra de progreso.

Michael Gerstenhaber, vicepresidente de gestión de producto en Google Cloud, agregó que el salto frente a la versión original no es solo de velocidad: el modelo ganó conocimiento del mundo real suficiente para reproducir locaciones específicas (si se le pide un fondo de las Tierras Altas de Escocia, genera el paisaje real) y mejoró la consistencia de personajes para tareas como construir storyboards. Ambos modelos incluyen la marca de agua SynthID y credenciales de contenido C2PA, verificables desde la app de Gemini, Gemini en Chrome o el Buscador.

La cifra que de verdad debería inquietar a la competencia no es ningún puntaje Elo: es la velocidad de adopción que ya demostró la familia Nano Banana. La versión original, lanzada en agosto de 2025, sumó 13 millones de usuarios en sus primeros cuatro días y superó los cinco mil millones de imágenes generadas hacia mediados de octubre de ese año, según cifras que en su momento recogió el medio español Xataka. Con un escalón todavía más rápido y barato, Google no compite solo por la calidad de la imagen: compite por quedarse con el flujo de trabajo completo de quien produce contenido visual a escala, antes de que OpenAI o Microsoft afinen su propia respuesta.

Fuentes: 1, 2, 3

Alejandro Castillo Leone imagen de perfil
por Alejandro Castillo Leone

Soy un amante del arte y la cultura. Desde el 2021 dirijo una web dedicada a la historia de mi país y he emprendido la misión de vivir para la cultura, alimentándome principalmente del ámbito Hispanoamericano.

Leer más de Tecnología y Ciencia