June 26, 2024Open Access

Modelos analíticos interpretáveis preditivos para previsão de custos de saúde usando dados abertos de saúde

Key Points

Key points are not available for this paper at this time.

Abstract

Os gastos com saúde, uma proporção considerável dos orçamentos nacionais, aumentaram rapidamente. Como resultado, considerável pesquisa é dedicada ao controle dos custos de saúde. Muitos esforços estão em andamento para melhorar a transparência dos preços médicos. A transparência de preços ajudará os pacientes a se tornarem melhor informados, permitindo que eles busquem cuidados que possam pagar, levando, eventualmente, a eficiência nos mercados de saúde. Isso exige primeiro que os dados de preços médicos sejam disponibilizados publicamente. Como os dados brutos de preços podem ser grandes e abranger múltiplas condições, é necessário fornecer um mecanismo para processar os dados a fim de facilitar seu uso e compreensão. Recomendamos a criação de modelos computacionais que prevejam os custos de saúde para várias condições e demografias de pacientes. Pacientes e prestadores podem interrogar os dados subjacentes para entender a variação dos custos de saúde em relação a condições médicas e variáveis demográficas de interesse, incluindo idade. Demonstramos nossa abordagem criando modelos preditivos usando técnicas recentes de aprendizado de máquina. Analisamos dados anônimos de pacientes do Sistema Cooperativo de Planejamento e Pesquisa do Estado de Nova York, consistindo em 2,34 milhões de registros de 2019. Construímos modelos para prever custos com mais de duas dúzias de variáveis de pacientes, incluindo códigos de diagnóstico, gravidade da doença, idade e outras variáveis demográficas. Investigamos três modelos: regressão, árvores de decisão e florestas aleatórias. Esses modelos são explicáveis. Analisamos características para determinar aquelas que eram preditivas dos custos totais. Determinamos que o código de diagnóstico, a gravidade da doença e a duração da estadia eram bons preditores dos custos totais, enquanto raça e gênero não são úteis na previsão dos custos totais. Obtivemos o melhor desempenho usando um regressor catboost, que rendeu um score R2 de 0,85, melhor do que os valores relatados na literatura.

Modelos analíticos interpretáveis preditivos para previsão de custos de saúde usando dados abertos de saúde

Key Points

Abstract

Cite This Study