Google quiere convertir el cursor en una interfaz de IA con Gemini y Magic Pointer
Google prueba un cursor con Gemini que entiende lo que señalas y ejecuta tareas con menos prompts.
TL;DR:
Google DeepMind presentó un prototipo de puntero con IA que entiende el contexto visual y semántico de la pantalla.
La tecnología llegará a Gemini en Chrome y después a Magic Pointer en Googlebook.
La apuesta de Google es reducir prompts largos y permitir acciones con gestos, voz y contexto.
Google DeepMind presentó el 12 de mayo de 2026 un prototipo de puntero impulsado por Gemini que busca cambiar la forma en que los usuarios interactúan con la IA en una computadora. En lugar de escribir prompts largos o copiar contenido a una ventana separada, la idea es que el cursor entienda qué está señalando el usuario —un texto, una tabla, una imagen, una fecha o un objeto— y permita ejecutar acciones desde ahí. Google ya empezó a llevar estos principios a Gemini en Chrome y planea integrarlos en Magic Pointer, una función clave de sus nuevas laptops Googlebook.
El AI-enabled pointer es un puntero con inteligencia artificial que interpreta el contenido alrededor del cursor para convertirlo en una acción posible.
La diferencia está en el contexto. Un cursor tradicional solo indica posición. El prototipo de DeepMind intenta entender qué hay debajo: una palabra, un párrafo, una parte de una imagen, un bloque de código o un dato dentro de una tabla. Con esa lectura, el usuario puede pedir tareas más cortas: “arregla esto”, “mueve eso”, “resume esta parte” o “convierte estos datos en una gráfica”.
Google lo plantea como una respuesta a un problema cotidiano: muchas herramientas de IA viven en su propia ventana. Eso obliga al usuario a cortar su flujo de trabajo, copiar información, describir el contexto y esperar una respuesta. DeepMind quiere invertir esa lógica: que la IA aparezca dentro de la app, página o documento donde ya está trabajando la persona.
La compañía resume su enfoque en cuatro principios de interacción:
- Mantener el flujo: la IA debe funcionar dentro de las apps y sitios donde el usuario ya está trabajando.
- Mostrar y decir: el usuario señala algo y complementa con voz o una instrucción breve.
- Aprovechar “esto” y “eso”: el sistema debe interpretar referencias naturales sin exigir prompts detallados.
- Convertir pixeles en entidades accionables: fechas, lugares, objetos o notas pueden transformarse en recordatorios, rutas, listas o enlaces útiles.
Del prompt largo al gesto corto
Los ejemplos que muestra DeepMind son sencillos, pero apuntan a un cambio importante en la interfaz. Un usuario podría señalar un PDF y pedir un resumen con viñetas para pegarlo en un correo. También podría pasar el cursor sobre una tabla de estadísticas y pedir una versión en gráfica de pastel, o seleccionar una receta para duplicar automáticamente los ingredientes.
En imágenes, el sistema puede ir más lejos. Si el usuario apunta a un edificio en una foto y pide indicaciones, Gemini ya tendría parte del contexto necesario. Si pausa un video de viajes sobre un restaurante, el sistema podría convertir esa ubicación visual en una entidad accionable, como un enlace para reservar o buscar el lugar en mapas.
La propuesta también toca programación y productividad. DeepMind dice que el sistema experimental puede detectar palabras, párrafos, zonas de una imagen o bloques de código. Eso vuelve más viable una interacción donde la persona no tenga que explicar cada detalle: basta con señalar el elemento correcto y pedir una acción concreta.
Gemini en Chrome será el primer campo de prueba
Google no está dejando esta idea solo como demo de laboratorio. La compañía dijo que ya está integrando estos principios en Chrome y en la experiencia de Googlebook.
En Chrome, la función permite usar el puntero para preguntarle a Gemini sobre una parte específica de una página web. Google plantea casos como seleccionar varios productos para compararlos o apuntar al sitio donde el usuario quiere visualizar un sillón nuevo dentro de una sala.
El movimiento también conecta con Google Labs’ Disco, un experimento web que combina navegación, pestañas y asistencia de IA. Disco ya describe un AI Enabled Pointer capaz de ofrecer respuestas rápidas sin abandonar la página, continuar conversaciones en un panel lateral, saltar a secciones relevantes y sumar partes útiles a un espacio generado por IA.
Magic Pointer será una de las apuestas de Googlebook
El segundo destino será Magic Pointer, una función para Googlebook, la nueva categoría de laptops de Google diseñada alrededor de Gemini Intelligence.
Google presentó Googlebook como una línea de laptops con hardware premium, integración con teléfonos Android y herramientas de IA en el centro de la experiencia. La compañía también promete widgets personalizados y acceso más directo a apps y archivos del teléfono desde la laptop.
En ese contexto, Magic Pointer funciona como el punto de contacto más visible entre Gemini y el sistema. Google describe la función como un cursor que cobra vida con sugerencias contextuales cuando el usuario lo mueve. Por ejemplo, apuntar a una fecha en un correo para crear una reunión, o seleccionar dos imágenes —como una sala y un sillón— para visualizarlas juntas.
La lectura estratégica es clara: Google no solo quiere meter un chatbot en más productos. Quiere que Gemini se convierta en una capa de interacción sobre el navegador, el sistema operativo y el hardware.
Ese giro podría hacer que la IA deje de sentirse como una app aparte y se vuelva una función de la interfaz. El riesgo, por supuesto, será la precisión: si el cursor interpreta mal qué está señalando el usuario, la promesa de rapidez puede convertirse en fricción. Pero si Google logra que el sistema entienda contexto sin obligar a escribir instrucciones largas, el viejo puntero podría convertirse en una de las superficies más importantes de la era Gemini.