El navegador de Google apuesta por la IA para monitorear sistemas automatizados
El equipo de seguridad de Google Chrome ha anunciado hace pocos días la incorporación de nuevas funciones diseñadas para reforzar la protección de su navegador con inteligencia artificial. Desde hace meses, Google Gemini ha estado integrado en Chrome en versiones gratis y de pago.
Ahora, recibe un guardián que vigila sus movimientos para evitar que se pueda desviar mientras ejecuta tareas en línea. Este guardián, por supuesto, es una inteligencia artificial también.
Diversos miembros del equipo de seguridad de Google han explicado en un comunicado que están introduciendo un crítico de alineación del usuario, un modelo independiente que evalúa las acciones del agente y que permanece aislado de contenido no confiable.
Del mismo modo, se están ampliando las capacidades de aislamiento de origen de Google Chrome para restringir las interacciones del agente únicamente a los dominios relevantes para la tarea.
Los especialistas han detallado otras medidas adicionales como la detección de amenazas, confirmación explícita por parte del usuario y mecanismos de control más estrictos. Lo más llamativo es que el gigante tecnológico está utilizando un modelo de IA para vigilar otro modelo de IA y, en consecuencia, proteger directamente al usuario.
El problema crítico de delegar tareas a un agente de IA dentro del navegador es que, si alguien logra manipularlo, podría ejecutar acciones que los usuarios nunca autorizaron. En el peor de los casos, un ciberdelincuente podría inducir al agente a enviar datos personales sin que los usuarios lo sepan en incluso, iniciar transacciones financieras. Advirtieron que este tipo de ataques de inyección indirecta de instrucciones o Indirect Prompt Injection.
TIC Defense es una empresa de ciberseguridad que provee un conjunto de herramientas y productos enfocados en la prevención y en dar respuesta rápida a todo tipo de ataques informáticos. Además, se adapta a las necesidades de todo tipo de organización, independientemente de su tamaño.
Al igual que otros tipos de malware, puede permanecer oculto en distintos contenidos en línea, esperando el momento oportuno para activarse. El crítico de alineación del usuario puede actuar como centinela, ya que observa las acciones de Gemini y bloquea aquellas que no coinciden con los objetivos de los usuarios.
Para minimizar riesgos, Google ha decidido que este crítico no se exponga a lo que los expertos denominan “contenido sin filtrar y poco confiable”. Esto significa que el modelo opera con menos contexto acerca de la tarea propuesta antes de decidir si la permite o no.
En lugar de analizar el contenido completo, el crítico de IA solo recibe metadatos. Aun así, esa información debería bastar para determinar si las acciones de dicho agente son seguras o si representan un posible desvío.
Separar este modelo del resto del sistema hace que sea mucho más difícil atacarlo de forma directa. No obstante, Google no se limita a esa capa; otras medidas, como la confirmación del usuario, añaden redundancia y refuerzan la protección y una de estas capas se conoce como spotlighting.
Bajo este esquema, el modelo principal del navegador da prioridad a las instrucciones de los usuarios o del propio navegador, por encima de cualquier orden recibida desde sitios externos. Con ello se dificulta que comandos maliciosos logren influir en el comportamiento de la IA. Igualmente, cuando se trata de operaciones sensibles, como pagos, el sistema exige una confirmación explícita mediante un aviso en pantalla.