Key points are not available for this paper at this time.
Die kontextuelle Repräsentation hat in der letzten Zeit eine zentrale Rolle in der Verarbeitung natürlicher Sprache (NLP) eingenommen. Modelle wie die bidirektionalen Encoder-Repräsentationen von Transformern (BERT) haben in diesem Bereich enorme Erfolge erzielt. Im Rahmen der vorliegenden Arbeit, als erster Versuch in der Bergbauindustrie, wird die BERT-Architektur zur Entwicklung des MineBERT-Modells angepasst, um die Klassifikation von Unfallnarrativen aus dem Datensatz der US-Mine Safety and Health Administration (MSHA) zu erreichen. In der mehrjährigen Forschung der Vergangenheit wurden von den Autoren mehrere Methoden des maschinellen Lernens (ML) eingesetzt, um die Erfolgsquoten bei der Klassifikation in neun bedeutenden MSHA-Unfallkategorien zu verbessern. Von neun Kategorien verzeichneten vier Hauptkategorien („Typgruppen“) und fünf „schmale Gruppen“ mit Random Forests (RF) durchschnittlich Erfolgsquoten von 75 % bzw. 42 %, während die falsch positiven Ergebnisse unter 5 % blieben. Innovative, merkmalbasierte NLP-Methoden wie das unfall-spezifische Experten-Wahl-Vokabular (ASECV) und Ähnlichkeitsbewertungsmethoden (SS) wurden entwickelt, um die RF-Erfolgsquoten zu verbessern. Eine Kombination all dieser Methoden („gestapelter“ Ansatz) konnte den Erfolg über RF (71 %) leicht auf 73,28 % für die Hauptkategorie „Eingeklemmt“ steigern. Homographen in den Narrativen wurden als das Hauptproblem identifiziert, das einen weiteren Erfolg verhinderte. Ihre Anwesenheit verursachte Mehrdeutigkeitsprobleme für Klassifikationsalgorithmen. Die Anpassung von BERT löste das Problem effektiv. Im Vergleich zu RF verbesserte die Implementierung von MineBERT die Erfolgsquoten in den Haupt- und schmalen Gruppen um 13 % bzw. 32 %, während die falsch positiven Ergebnisse unter 1 % blieben, was sehr signifikant ist. Die Implementierung von BERT in der Bergbauindustrie, die einzigartige technische Aspekte und Fachjargon aufweist, brachte eine Reihe von Herausforderungen in Bezug auf die Datenaufbereitung, die Auswahl von Hyperparametern und das Feintuning des Modells mit sich, um die beste Leistung zu erzielen, die in der aktuellen Forschung erreicht wurde.
Pothina et al. (Sat,) haben diese Frage untersucht.