Key points are not available for this paper at this time.
Maschinelles Lernen wird immer häufiger für sensible Anwendungen eingesetzt und ersetzt manchmal Menschen in kritischen Entscheidungsprozessen. Daher ist die Interpretierbarkeit dieser Algorithmen eine dringende Notwendigkeit. Ein beliebter Algorithmus zur Bereitstellung von Interpretierbarkeit ist LIME (Local Interpretable Model-Agnostic Explanation). In diesem Papier liefern wir die erste theoretische Analyse von LIME. Wir leiten geschlossene Ausdrucksformen für die Koeffizienten des interpretierbaren Modells ab, wenn die zu erklärende Funktion linear ist. Die gute Nachricht ist, dass diese Koeffizienten proportional zum Gradienten der zu erklärenden Funktion sind: LIME entdeckt tatsächlich bedeutungsvolle Merkmale. Unsere Analyse zeigt jedoch auch, dass schlechte Parameterentscheidungen dazu führen können, dass LIME wichtige Merkmale übersieht.
Garreau et al. (Fri,) haben diese Frage untersucht.