摘要 传统的增材制造刀具路径策略通常忽略了底层物理特性,导致缺陷和效率低下。本文提出了一种强化学习框架,将策略学习直接与粉末床熔融的有限元热模拟耦合,使代理能够从空间分辨的温度反馈中学习自适应刀具路径。通过程序生成的几何体以确保鲁棒的泛化能力,我们分别在简化环境和热耦合环境中训练深度Q网络和近端策略优化代理。结果表明,学习到的策略在速度上优于传统之字形基线,并能有效泛化到不规则几何体,发现了如由外向内扫描的热策略等新兴热控策略。
Schmeitz等人(星期三)研究了该问题。