概念瓶颈模型(CBMs)是旨在将高性能与事后可解释性结合的神经网络。CBMs首先将输入(例如图像)映射到高层次概念(例如可见物体及其属性),然后利用这些概念以可解释的方式解决下游任务(例如标记或评分图像)。然而,它们的性能和可解释性依赖于所学概念的质量。确保良好质量概念的常用策略是利用专家标注,但这些标注收集成本高且在应用中很少可用。研究人员最近通过引入“VLM-CBM”架构解决了这个问题,该架构用基础模型的弱监督替代了手动注释。然而,这样做对所学概念的质量影响尚不明确。为了解答这个问题,我们测试了最先进的VLM-CBMs,使用一系列重要指标对其所学概念进行了实证分析。我们的结果显示,具体任务的不同,VLM监督与专家标注之间可能存在显著差异,并且概念的准确性和质量之间并没有强相关性。我们的代码可在https://github.com/debryu/CQA获取。
Debole 等(Mon,)研究了这个问题。