• 第一个光束图像数据集,捕获多样的光学对准模式和参数 • 将光学共振腔对准视作一对光束模式回归任务 • 两阶段模型同时具备特征交互和细化,用于从粗到精的对准 • 在一种设备上训练,模型能够在不重新训练的情况下泛化到另一设备 • 在嵌入式边缘硬件上实现高精度实时推断 准确的激光共振腔对准对于提升工业激光制造和精密加工至关重要。然而,传统的手动或半自动方法高度依赖操作人员的专业知识,并且在多个对准参数之间的相互依赖性上面临挑战。为了解决这个问题,我们引入了第一个用于自动激光共振腔对准的真实世界图像数据集,该数据集是在实验室构建的共振腔设备上收集的。它包含超过6000张标注了四个关键对准参数(腔内光圈直径、输出耦合器的纵向和横向位移以及输出耦合器的轴向位置)的光束剖面图像,拥有超过50万对用于数据驱动对准的样本。给定一对在不同配置下展现出明显光束模式的光束剖面图像,系统预测重新对准共振腔所需的控制参数变化。利用这个数据集,我们提出了一种新颖的两阶段深度学习框架,用于自动共振腔对准。在第一阶段,采用跨注意力和相关差异模块增强的多尺度卷积神经网络提取特征,并输出对准参数的初步粗略预测。在第二阶段,通过减去成对特征表示计算特征差异图,并输入迭代细化模块以纠正残余的未对准。最终预测结合了粗略和细化估计,整合了全局上下文和细粒度的修正,以实现准确推断。我们在数据集和同一物理系统不同实例上进行的实验表明其在精度和实用性上优于手动对准。
Guo等人(周)研究了这个问题。