Diese überarbeitete Version enthält klarere architektonische Artefakte, verfeinerte Terminologie und erweiterte Anhangsmaterialien, die darauf abzielen, die Reproduzierbarkeit und die allgemeine strukturelle Klarheit zu verbessern. Dieses Papier präsentiert Verok V6, eine Systemarchitekturspezifikation, die ein ergänzendes Paradigma für die Sicherheit von KI durch deterministische Governance-Mechanismen vorschlägt, die zur Inferenzzeit funktionieren. Wir identifizieren eine distinct architektonische Asymmetrie in der aktuellen KI-Entwicklung: während die Fähigkeiten des Modells durch rigorose strukturelle Designs (z.B. Transformer-Architekturen) entwickelt werden, haben Sicherheitsprotokolle überwiegend auf probabilistischen, trainingsbasierten Methoden wie RLHF beruht. Unter der Annahme, dass Sicherheit eine strukturelle Eingrenzung erfordert, die der Fähigkeitsentwicklung analog ist, führt Verok V6 einen dreischichtigen Governance-Rahmen (Ausführung, Beobachtung, Governance) ein, der unabhängig von den Modellgewichten funktioniert. Diese Architektur funktioniert nicht durch die Veränderung des Lernens des Modells, sondern durch die Schaffung eines deterministischen "Chassis", innerhalb dessen der probabilistische "Motor" arbeitet – dies ermöglicht den sicheren Einsatz der maximalen Modellfähigkeit in risikoreichen Umgebungen. Funktionierende Prototypen, die im Google AI Studio entwickelt wurden, validieren die architektonische Machbarkeit. Diese einheitliche Spezifikation integriert theoretische Grundlagen mit praktischen Implementierungsleitfäden und zeigt, dass deterministische Sicherheitsgarantien durch strukturelles Design erreichbar sind, während die volle Modellfähigkeit erhalten bleibt.
Thanh Phước Anh Nguyễn (Sun,) hat diese Frage untersucht.