Key points are not available for this paper at this time.
Problemas de empacotamento, também conhecidos como problemas de aninhamento ou problemas de empacotamento em contêineres, são problemas clássicos e populares NP-difíceis com alta complexidade computacional. Inspirados pelo aprendizado por reforço (RL) clássico, estabelecemos um modelo matemático para o empacotamento de peças irregulares em duas dimensões (2D), combinado com características de peças irregulares em 2D. Um algoritmo de RL baseado em aprendizado de Monte Carlo (MC), Q-learning e Sarsa-learning é proposto neste artigo para resolver um problema de empacotamento de peças irregulares em 2D. Além disso, mecanismos de recompensa-retorno e atualização de estratégia baseados no empacotamento de peças foram projetados. Por fim, o caso de teste padrão de peças irregulares foi utilizado para testes experimentais a fim de analisar o efeito de otimização do algoritmo. Os resultados experimentais mostram que o algoritmo proposto pode realizar com sucesso o empacotamento de peças irregulares em 2D. Um efeito de otimização semelhante ou melhor pode ser obtido em comparação com alguns algoritmos heurísticos clássicos. O algoritmo proposto é uma tentativa inicial de usar aprendizado de máquina para resolver problemas de empacotamento irregular em 2D. Por um lado, nosso algoritmo híbrido de RL pode fornecer uma base para o subsequente aprendizado por reforço profundo (DRL) para resolver problemas de empacotamento, o que tem uma importância teórica de longo alcance. Por outro lado, tem uma importância prática para melhorar a taxa de utilização de matérias-primas e ampliar o campo de aplicação do aprendizado de máquina.
Fang et al. (Sun,) estudaram essa questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: