What question did this study set out to answer?

Die Forschung hat zum Ziel, einen integrierten Krypto-Experten in großen Sprachmodellen zu schaffen, um Sicherheit und Effizienz zu verbessern.

March 15, 2026Open Access

Ein integrierter Krypto-Experte für Künstliche Intelligenz: Wie weit ist der Horizont?

Read Full Paperexternally

Key Points

Die Forschung hat zum Ziel, einen integrierten Krypto-Experten in großen Sprachmodellen zu schaffen, um Sicherheit und Effizienz zu verbessern.
Entwickelte einen differenzierbaren Proxy für den Advanced Encryption Standard (AES) unter Verwendung angepasster Neuronen-Einheiten.
Integrierte den Proxy in eine Mixture-of-Expert (MoE) Architektur für die autonome Token-Verschlüsselung.
Implementierte einen echten AES-Austausch für sichere Inferenz.
Zeigte signifikante Reduktionen der Neuronenzahl und der Latenz im Vergleich zu früheren Methoden.
Milderte kontinuierliche differentielle Angriffe und bewahrte gleichzeitig die Nützlichkeit für nachgelagerte Aufgaben.
Zeigte die Kombination von kryptografischer Sicherheit und Optimierung des tiefen Lernens.

Abstract

Dieses Papier schlägt ein eingebautes Framework vor, das einen speziellen "Krypto-Experten" direkt in die Architektur großer Sprachmodelle (LLMs) integriert. Als erster Versuch entwerfen wir einen differenzierbaren Proxy, der auf den Advanced Encryption Standard (AES)-Algorithmus zugeschnitten ist und unsere angepassten Neuronen-Einheiten, einschließlich SoftXOR, SoftLUT und GF-conv Neuronen, verwendet. Diese Einheiten bieten funktionale Äquivalenz zum AES im Booleschen Bereich und ermöglichen stabile Gradienten für die Rückpropagation. Durch die Integration dieses differenzierbaren Proxys als spezialisierten Experten in ein Mixture-of-Expert (MoE) LLM lernt das LLM, sensible Tokens während der Trainingsphase autonom zu routen und zu verschlüsseln. Nach dem Training wird der differenzierbare Proxy nahtlos durch eine echte und diskrete AES-Implementierung ersetzt, um nachweisbare Sicherheit bei der Inferenz zu gewährleisten. Unsere empirischen Bewertungen zeigen, dass unser Ansatz die Neuronenzahl und Latenz im Vergleich zu früheren ReLU-basierten Darstellungen signifikant reduziert, kontinuierliche differentielle Angriffe mindert und den End-to-End-Datenschutz durchsetzt, ohne die Nützlichkeit nachgelagerter Aufgaben zu beeinträchtigen. Wir erwarten, dass dieser Versuch als Katalysator für zukünftige Forschungen zur nahtlosen Fusion formaler kryptografischer Garantien und tiefen Lernberechnungsgraphen dient.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jiasi Weng

Jian Weng

Ming Li

China University of Geosciences

Actions

Institutions

Jinling Institute of Technology

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Ein integrierter Krypto-Experte für Künstliche Intelligenz: Wie weit ist der Horizont?

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study