本文介绍了动态一致性窗口(DCW)框架,这是一种监控系统实时一致性的人工智能安全结构生存方法,而不是在生成后过滤输出。该框架定义了一个追踪结构退化的五维缺陷向量,基于横向耦合的出现阈值,以及两个状态变量,即一致性边际 m 和稳定参数 Λ,这些共同决定系统状态。我们通过认知免疫系统(CIS)扩展该框架,该系统在整合之前评估新学习的影响提供了四个决策路径:接受、拒绝、隔离和重构。重构机制引入了人类一致性桥接,类似于生物免疫中调节性 T细胞的耐受性。对21个测试案例的实证验证表明,该框架能够正确区分局部一致性和横向生存性,尽管局部指标令人满意,但聚合的非一致内容仍导致 Λ = 0.44 和 m = −1.17。一个工作实现(CMCI v8.1.4)作为生产服务进行了部署,配备了REST API和实时仪表盘。与此项工作相关的四项专利在加拿大知识产权局待审。
Christian St-Louis (Sun) 研究了这个问题。