Nachrichtenvideos sind eine wichtige Informationsquelle. Ihre schnelle Verbreitung über digitale Plattformen birgt jedoch das Risiko, Fehlinformationen zu verbreiten, und erfordert daher zuverlässige Methoden automatisierter Faktenchecks. Im Unterschied zu textbasierten Nachrichten vereinen Videos gesprochene Sprache, visuelle Elemente und Metadaten, was eine automatische Analyse erschwert. Diese Masterarbeit präsentiert einen Ansatz zur Extraktion strukturierter Fakten aus Nachrichtenvideos, die in weiterer Folge von Faktencheck-Anwendungen verarbeitet werden können. Die Arbeit gibt einen Überblick über den Stand der Forschung im Bereich des automatisierten Faktencheckens sowie der Extraktion von Informationen. Ein besonderer Fokus liegt dabei auf videobasierten Ansätzen. Der entwickelte Prototyp integriert verschiedene Technologien, darunter den Microsoft Azure Video Indexer zur Analyse von Video- und Audiodaten sowie Methoden der natürlichen Sprachverarbeitung wie Named Entity Recognition und extraktive Textzusammenfassung. Das Ergebnis der Arbeit ist eine Pipeline zur Extraktion von Fakten, die Personen, Organisationen und Ereignisse erkennt und verknüpfte Informationen anhand eines Schemas, basierend auf dem schema.org-Standard, strukturiert. Im Zuge dieser Masterarbeit wurde ein Prototyp implementiert, der das Hochladen von Nachrichtenvideos, deren Verarbeitung sowie die Generierung strukturierter Faktenberichte in maschinenlesbarem Format unterstützt. Die Implementierung kombiniert cloudbasierte und lokale NLP-Komponenten, um eine robuste Extraktion der Fakten zu gewährleisten. Für die Evaluation des Prototyps wurden 31 Nachrichtenvideos des Senders BBC analysiert. Anhand der Ergebnisse konnte festgestellt werden, dass Fakten zu Personen und Ereignissen zuverlässig extrahiert und strukturiert werden. Organisationen wurden vom Prototyp jedoch deutlich schlechter erkannt. Häufige Fehlerquellen konnten bei der Schreibweise von Namen, bei zu unspezifischen oder zu allgemein formulierten Informationen sowie bei unpräzisen Zeitangaben festgestellt werden. Diese Masterarbeit präsentiert einen Ansatz zur automatisierten Extraktion von Fakten aus Nachrichtenvideos. Die Ergebnisse der Evaluierung des Prototyps verdeutlichen, in welchen Bereichen Verbesserungsbedarf besteht. Diese beziehen sich vor allem auf die Verarbeitung von Organisationen, die korrekte Extraktion von Informationseinheiten sowie von Zeitdaten. In Zukunft könnte der Fokus auf der Implementierung zusätzlicher Entitätstypen, der optimierten Validierung extrahierter Werte sowie der Integration weiterer Sprachen und Nachrichtenquellen liegen.
Angelika Eva Kapeller (Thu,) studied this question.