基于点云的场景图预测旨在以结构化、可解释的方式识别三维场景中的物体, 并推断它们之间的关系. 然而, 现有多数方法依赖于同构图 (homogeneous graph) 的学习范式, 将所有关系类型统一建模在单一图结构中; 这一设计容易受到长尾分布偏差 (long-tail bias) 的影响, 难以充分刻画三维场景中多样且不平衡的关系分布. 尽管有研究尝试引入异构图 (heterogenous graph) 以缓解信息混杂问题, 但依赖于静态边类型预测以构建异构子图, 且子图之间缺乏跨类型的协同推理与一致性约束. 为了克服以上局限, 本文提出一种基于异构子图协同推理的点云场景图预测方法. 核心思想是将完整场景图分解为多个语义或几何属性明确的异构子图, 各子图首先在无跨类型干扰的条件下独立推理, 以充分学习关系特定的依赖结构; 随后, 通过跨子图协同融合机制, 将多关系类型的推理结果统一约束到一致的全局场景图中. 该 “子图推理–协同融合” 的迭代流程不仅提升了模型的可解释性和结构一致性, 也缓解了长尾关系分布带来的性能瓶颈. 大量实验结果验证了本文方法的有效性.
Zhang et al. (Sun,) studied this question.