L'évolution rapide des menaces cybernétiques exige une validation continue et de haute fidélité des postures défensives des entreprises. Les méthodologies conventionnelles de simulation de violation et d'attaque (BAS) reposent sur des manuels statiques qui échouent à émuler le raisonnement adaptatif des menaces persistantes avancées modernes (APT). Dans cet article, nous présentons VANGUARD, un nouveau cadre d'"agent cognitif violet". VANGUARD fusionne un agent de l'équipe rouge piloté par un modèle de langage large (LLM) basé sur une architecture cognitive de raisonnement et d'action (ReAct), avec un pipeline de validation de télémétrie de l'équipe bleue en temps réel via la pile Elasticsearch (ELK). Contrairement aux AIs offensives en boîte noire, VANGUARD quantifie mathématiquement son propre temps de détection (TTD) et agit ensuite comme un ingénieur DefSecOps en synthétisant et en déployant de manière autonome des heuristiques SOC sur mesure pour combler les lacunes. Nous abordons le problème critique de l'"alignement agentique" dans l'IA offensive en mettant en œuvre une FATALOSBLOCKLIST mathématiquement stricte, accordant à l'agent une autonomie opérationnelle totale tout en prévenant en toute sécurité la destruction de l'hôte. Nos résultats démontrent que VANGUARD exploite avec succès plusieurs classes de vulnérabilités à travers des cibles d'entreprise diverses (Web générique, stockage cloud, ERP ancien) de manière autonome, tout en identifiant des taux d'alerte SOC catastrophiques de 0.0 % et en réparant immédiatement le SIEM Elasticsearch de la cible avec des règles défensives fonctionnelles.
MANISH TRIPATHY (mar,) a étudié cette question.