Key points are not available for this paper at this time.
Anomalien sind Datenpunkte, die selten und unterschiedlich sind. Aufgrund dieser Eigenschaften zeigen wir, dass Anomalien anfällig für einen Mechanismus namens Isolation sind. Dieser Artikel schlägt eine Methode namens Isolation Forest (i Forest) vor, die Anomalien rein basierend auf dem Konzept der Isolation erkennt, ohne irgendwelche Distanz- oder Dichtemaße zu verwenden – grundlegend anders als alle bestehenden Methoden. Als Ergebnis ist i Forest in der Lage, Subsampling (i) zu nutzen, um eine niedrige lineare Zeitkomplexität und einen geringen Speicherbedarf zu erreichen, und (ii) effektiv mit den Auswirkungen von Swamping und Maskierung umzugehen. Unsere empirische Bewertung zeigt, dass i Forest ORCA, One-Class SVM, LOF und Random Forests hinsichtlich AUC, Verarbeitungszeit übertrifft, und robust gegen Maskierungs- und Swamping-Effekte ist. i Forest funktioniert auch gut bei hochdimensionalen Problemen mit einer großen Anzahl irrelevanter Attribute und wenn Anomalien im Trainingssample nicht verfügbar sind.
Liu et al. (Thu,) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: