Key points are not available for this paper at this time.
Tiefe neuronale Netzwerke werden weitgehend für die Klassifikation verwendet. Diese tiefen Modelle leiden oft unter einem Mangel an Interpretierbarkeit - sie sind aufgrund ihrer nichtlinearen Natur besonders schwer zu verstehen. Infolgedessen werden neuronale Netzwerke oft als "schwarze Kästen" behandelt und in der Vergangenheit rein trainiert, um die Genauigkeit der Vorhersagen zu optimieren. In dieser Arbeit erstellen wir eine neuartige Netzwerkarchitektur für Deep Learning, die von sich aus ihre eigene Argumentation für jede Vorhersage erklärt. Diese Architektur enthält einen Autoencoder und eine spezielle Prototypenschicht, in der jede Einheit dieser Schicht einen Gewichtungsvektor speichert, der einem kodierten Trainingsinput ähnelt. Der Encoder des Autoencoders ermöglicht es uns, Vergleiche im latenten Raum anzustellen, während der Decoder uns erlaubt, die gelernten Prototypen zu visualisieren. Das Trainingsziel hat vier Terme: einen Genauigkeitsterm, einen Term, der jeden Prototyp ermutigt, ähnlich wie mindestens einen kodierten Input zu sein, einen Term, der jeden kodierten Input ermutigt, nahe an mindestens einem Prototyp zu sein, und einen Term, der eine treue Rekonstruktion durch den Autoencoder fördert. Die in der Prototypenschicht berechneten Distanzen werden als Teil des Klassifikationsprozesses verwendet. Da die Prototypen während des Trainings gelernt werden, kommt das gelernte Netzwerk von Natur aus mit Erklärungen für jede Vorhersage, und die Erklärungen sind treu dem, was das Netzwerk tatsächlich berechnet.
Li et al. (Sun,) haben diese Frage untersucht.