Key points are not available for this paper at this time.
Algoritmos de Aprendizado de Máquina Supervisionado (SML) como Gradient Boosting, Random Forest e Redes Neurais tornaram-se populares nos últimos anos devido ao seu aumento de desempenho preditivo em relação aos métodos estatísticos tradicionais. Isso é especialmente verdadeiro com grandes conjuntos de dados (milhões ou mais observações e centenas a milhares de preditores). No entanto, a complexidade dos modelos SML os torna opacos e difíceis de interpretar sem ferramentas adicionais. Recentemente, tem havido muito interesse em desenvolver diagnósticos globais e locais para interpretar e explicar modelos SML. Neste artigo, propomos modelos e efeitos localmente interpretáveis baseados em particionamento supervisionado (árvores) referidos como LIME-SUP. Isso contrasta com a abordagem KLIME, que é baseada na clusterização do espaço dos preditores. Descrevemos o LIME-SUP com base no ajuste de árvores à resposta ajustada (LIM-SUP-R) assim como as derivadas da resposta ajustada (LIME-SUP-D). Comparamos os resultados com KLIME e descrevemos suas vantagens usando simulação e dados reais.
Hu et al. (Sat,) estudaram essa questão.