Un reciente informe de Google Threat Intelligence Group describe un cambio claro en el uso adversario de la IA: los atacantes ya no la emplean solo para ganar velocidad, sino también para integrar capacidades maliciosas dentro de sus operaciones y automatizar partes del ataque. El informe señala que actores de distintos países están usando modelos como Gemini para tareas de reconocimiento, redacción de phishing, generación de scripts, investigación de vulnerabilidades, traducción de contenido y evasión de defensas, mientras el mercado negro de herramientas de IA ilícitas se vuelve más maduro.
Entre los hallazgos más relevantes aparecen familias de malware con IA integrada, como Promptflux y Promptsteal, capaces de generar código malicioso de forma dinámica, ofuscarse y cambiar su comportamiento durante la ejecución. Google también detecta intentos de “jailbreak” con tácticas de ingeniería social, por ejemplo, suplantando a estudiantes o investigadores para convencer al modelo de que devuelva respuestas bloqueadas, y el uso de herramientas de IA ilícitas diseñadas específicamente para phishing, malware y búsqueda de debilidades en sistemas.
El informe apunta además a una evolución importante: la IA adversaria pasará de ser experimental a normalizarse, y los agentes de IA se convertirán en una pieza central tanto para los atacantes como para los defensores. Eso eleva el riesgo de “prompt injection”, de agentes ocultos dentro de empresas y de automatizaciones mal controladas, por lo que el informe de Google insiste en reforzar salvaguardas, revisar accesos, limitar el uso de modelos en entornos sensibles y monitorizar de cerca cualquier comportamiento anómalo en flujos de trabajo con IA.
Fuente: Google