Agentic AI Security
Un agente autónomo no es una API: decide, encadena herramientas y recuerda. Cada una de esas capacidades representa una superficie de ataque distinta.
Un agente de IA puede ejecutar exactamente el código que tiene y aun así ser secuestrado. Una instrucción oculta en un documento puede redirigir su objetivo, o una herramienta puede hacer mucho más de lo que su nombre sugiere. El modelo obedece sin necesariamente comprender el contexto completo.
Probamos el agente como sistema completo, no el prompt aislado: goal hijacking por inyección indirecta, abuso de herramientas y permisos excesivos, riesgos en la cadena de suministro de plugins y proveedores externos, y envenenamiento de memoria y persistencia entre sesiones.
Cuando estos agentes procesan datos confidenciales, los ejecutamos en entornos de cómputo confidencial para que ni el proveedor ni nosotros podamos acceder a la información en claro. Más en Cómputo confidencial (TEE).
Ficha técnica
- Incluye
- Pruebas de goal hijacking e inyección indirecta, auditoría de uso de herramientas y permisos, análisis de cadena de suministro de plugins y proveedores externos, pruebas de envenenamiento de memoria y persistencia, y evaluación de riesgos en entornos con datos sensibles.
- Entregable
- Mapa de la superficie de ataque del agente, escenarios de abuso reproducibles con impacto claro y controles concretos: límites y validación de herramientas, aislamiento de memoria y contexto, restricciones de permisos y validación de entradas no confiables.
- Para quién
- Equipos que despliegan agentes autónomos con acceso a herramientas, datos o acciones de impacto: copilots internos, agentes de operaciones, asistentes con permisos de escritura y similares.
¿Querés revisar este frente con nosotros?
Una conversación técnica, sin libreto de ventas. Te decimos con franqueza si el riesgo está en tu código, en tus incentivos o en tu agente, y si podemos aportar.
