What type of study is this?

This is a Quantitative Study study.

October 12, 2025Open Access

Aprendizado Ótimo de Políticas para Tratamento de Múltiplas Ações com Preferência de Risco usando Stata

Key Points

O algoritmo de aprendizado de políticas ótimas melhora a atribuição de tratamento considerando preferências de risco e covariáveis.
O método mostra a estimativa de bem-estar máximo através do ajuste de regressão e outras técnicas.
Incorpora preferências de risco, como neutro em relação ao risco, avesso ao risco linear e avesso ao risco quadrático.
A representação gráfica da política ótima melhora a compreensão das atribuições de tratamento.

Abstract

Este artigo apresenta o comando "oplₘafb" distribuído pela comunidade Stata (e o comando acompanhante "oplₘaᵥf"), para implementar o algoritmo de Aprendizado Ótimo de Políticas (OPL) de primeira linha para estimar a melhor atribuição de tratamento dada a observação de um resultado, um tratamento de múltiplas ações (ou multi-braços) e um conjunto de covariáveis observadas (características). Permite diferentes preferências de risco na tomada de decisão (ou seja, neutro em relação ao risco, avesso ao risco linear e avesso ao risco quadrático) e fornece uma representação gráfica da política ótima, juntamente com uma estimativa do bem-estar máximo (ou seja, a função de valor estimada na política ótima) usando ajuste de regressão (RA), ponderação por probabilidade inversa (IPW) e fórmulas duplamente robustas (DR).

Aprendizado Ótimo de Políticas para Tratamento de Múltiplas Ações com Preferência de Risco usando Stata

Key Points

Abstract

Cite This Study