Dieses Papier schlägt ein eingebautes Framework vor, das einen speziellen "Krypto-Experten" direkt in die Architektur großer Sprachmodelle (LLMs) integriert. Als erster Versuch entwerfen wir einen differenzierbaren Proxy, der auf den Advanced Encryption Standard (AES)-Algorithmus zugeschnitten ist und unsere angepassten Neuronen-Einheiten, einschließlich SoftXOR, SoftLUT und GF-conv Neuronen, verwendet. Diese Einheiten bieten funktionale Äquivalenz zum AES im Booleschen Bereich und ermöglichen stabile Gradienten für die Rückpropagation. Durch die Integration dieses differenzierbaren Proxys als spezialisierten Experten in ein Mixture-of-Expert (MoE) LLM lernt das LLM, sensible Tokens während der Trainingsphase autonom zu routen und zu verschlüsseln. Nach dem Training wird der differenzierbare Proxy nahtlos durch eine echte und diskrete AES-Implementierung ersetzt, um nachweisbare Sicherheit bei der Inferenz zu gewährleisten. Unsere empirischen Bewertungen zeigen, dass unser Ansatz die Neuronenzahl und Latenz im Vergleich zu früheren ReLU-basierten Darstellungen signifikant reduziert, kontinuierliche differentielle Angriffe mindert und den End-to-End-Datenschutz durchsetzt, ohne die Nützlichkeit nachgelagerter Aufgaben zu beeinträchtigen. Wir erwarten, dass dieser Versuch als Katalysator für zukünftige Forschungen zur nahtlosen Fusion formaler kryptografischer Garantien und tiefen Lernberechnungsgraphen dient.
Building similarity graph...
Analyzing shared references across papers
Loading...
Jiasi Weng
Jian Weng
Ming Li
China University of Geosciences
Jinling Institute of Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
Weng et al. (Fri,) untersuchten diese Frage.
synapsesocial.com/papers/69b606af83145bc643d1cef2 — DOI: https://doi.org/10.5281/zenodo.18995804