A antecipação da interação 3D entre humanos e objetos (HOI) visa prever o movimento futuro dos humanos e dos objetos manipulados, condicionada ao contexto histórico. Geralmente, os humanos articulados e os objetos rígidos exibem diferentes padrões de movimento, devido às suas distintas propriedades físicas intrínsecas. No entanto, essa distinção é ignorada pela maioria dos trabalhos existentes, que pretendem capturar a dinâmica de humanos e objetos dentro de um único modelo de previsão. Neste trabalho, propomos uma nova estrutura de difusão desacoplada consistente em contato, CoopDiff, que emprega duas ramificações distintas para desacoplar a modelagem do movimento humano e do objeto, com os pontos de contato humano-objeto servindo como âncoras compartilhadas para unir a geração de movimento entre as ramificações. A ramificação de dinâmica humana visa prever um movimento humano altamente estruturado, enquanto a ramificação de dinâmica do objeto se concentra no movimento do objeto com traduções e rotações rígidas. Essas duas ramificações são unidas por uma série de pontos de contato compartilhados com restrição de consistência para previsão coerente de movimento humano-objeto. Para aprimorar ainda mais a consistência humano-objeto e a confiabilidade da previsão, propomos um módulo de interação dirigido por humanos para guiar a modelagem do movimento do objeto. Experimentos extensivos nos conjuntos de dados BEHAVE e Human-object Interaction demonstram que o CoopDiff supera os métodos de ponta atuais.
Lin et al. (Sun,) estudaram essa questão.