March 3, 2026Open Access

一种基于光束图像数据集的两阶段学习框架，用于自动激光共振腔对准

Key Points

自动激光共振腔对准在嵌入式边缘硬件上实现了高精度和实时推断，降低了对手动方法的依赖。
该数据集包括超过6000张标注的光束剖面图像，促进了一种新颖的两阶段机器学习模型用于对准预测。
在第一阶段，多尺度卷积神经网络提取特征并提供对准参数的粗略预测，这对于提高精度至关重要。
该两阶段模型有效泛化到不同设备，无需重新训练，表明其在各种激光系统中的实用应用。

Abstract

• 第一个光束图像数据集，捕获多样的光学对准模式和参数 • 将光学共振腔对准视作一对光束模式回归任务 • 两阶段模型同时具备特征交互和细化，用于从粗到精的对准 • 在一种设备上训练，模型能够在不重新训练的情况下泛化到另一设备 • 在嵌入式边缘硬件上实现高精度实时推断准确的激光共振腔对准对于提升工业激光制造和精密加工至关重要。然而，传统的手动或半自动方法高度依赖操作人员的专业知识，并且在多个对准参数之间的相互依赖性上面临挑战。为了解决这个问题，我们引入了第一个用于自动激光共振腔对准的真实世界图像数据集，该数据集是在实验室构建的共振腔设备上收集的。它包含超过6000张标注了四个关键对准参数（腔内光圈直径、输出耦合器的纵向和横向位移以及输出耦合器的轴向位置）的光束剖面图像，拥有超过50万对用于数据驱动对准的样本。给定一对在不同配置下展现出明显光束模式的光束剖面图像，系统预测重新对准共振腔所需的控制参数变化。利用这个数据集，我们提出了一种新颖的两阶段深度学习框架，用于自动共振腔对准。在第一阶段，采用跨注意力和相关差异模块增强的多尺度卷积神经网络提取特征，并输出对准参数的初步粗略预测。在第二阶段，通过减去成对特征表示计算特征差异图，并输入迭代细化模块以纠正残余的未对准。最终预测结合了粗略和细化估计，整合了全局上下文和细粒度的修正，以实现准确推断。我们在数据集和同一物理系统不同实例上进行的实验表明其在精度和实用性上优于手动对准。

一种基于光束图像数据集的两阶段学习框架，用于自动激光共振腔对准

Key Points

Abstract

Cite This Study