Key points are not available for this paper at this time.
Os processos de decisão de Markov parcialmente observáveis (POMDPs) dependem da suposição chave de que as distribuições de probabilidade são conhecidas de forma precisa. Os POMDPs robustos (RPOMDPs) aliviam essa preocupação ao definir probabilidades imprecisas, chamadas de conjuntos de incerteza. Enquanto os MDPs robustos foram amplamente estudados, o trabalho sobre RPOMDPs é limitado e foca principalmente em métodos algorítmicos de solução. Expandimos a compreensão teórica dos RPOMDPs ao mostrar que 1) diferentes suposições sobre os conjuntos de incerteza afetam políticas e valores ótimos; 2) os RPOMDPs têm uma semântica de jogo estocástico parcialmente observável (POSG); e 3) o mesmo RPOMDP com diferentes suposições leva a POSGs semanticamente diferentes e, assim, a políticas e valores diferentes. Essas novas semânticas para RPOMDPs dão acesso a resultados para o modelo POSG amplamente estudado; concretamente, mostramos a existência de um equilíbrio de Nash. Finalmente, classificamos a literatura existente sobre RPOMDP usando nossas semânticas, esclarecendo sob quais suposições de incerteza essas obras existentes operam.
Bovy et al. (Quarta,) estudaram essa questão.