January 8, 2023Open Access

Um Algoritmo Híbrido de Aprendizado por Reforço para Problemas de Empacotamento Irregular em 2D

Key Points

Key points are not available for this paper at this time.

Abstract

Problemas de empacotamento, também conhecidos como problemas de aninhamento ou problemas de empacotamento em contêineres, são problemas clássicos e populares NP-difíceis com alta complexidade computacional. Inspirados pelo aprendizado por reforço (RL) clássico, estabelecemos um modelo matemático para o empacotamento de peças irregulares em duas dimensões (2D), combinado com características de peças irregulares em 2D. Um algoritmo de RL baseado em aprendizado de Monte Carlo (MC), Q-learning e Sarsa-learning é proposto neste artigo para resolver um problema de empacotamento de peças irregulares em 2D. Além disso, mecanismos de recompensa-retorno e atualização de estratégia baseados no empacotamento de peças foram projetados. Por fim, o caso de teste padrão de peças irregulares foi utilizado para testes experimentais a fim de analisar o efeito de otimização do algoritmo. Os resultados experimentais mostram que o algoritmo proposto pode realizar com sucesso o empacotamento de peças irregulares em 2D. Um efeito de otimização semelhante ou melhor pode ser obtido em comparação com alguns algoritmos heurísticos clássicos. O algoritmo proposto é uma tentativa inicial de usar aprendizado de máquina para resolver problemas de empacotamento irregular em 2D. Por um lado, nosso algoritmo híbrido de RL pode fornecer uma base para o subsequente aprendizado por reforço profundo (DRL) para resolver problemas de empacotamento, o que tem uma importância teórica de longo alcance. Por outro lado, tem uma importância prática para melhorar a taxa de utilização de matérias-primas e ampliar o campo de aplicação do aprendizado de máquina.

Bookmark

View Full Paper