What question did this study set out to answer?

The aim is to develop a method to automatically extract structured facts from news videos for fact-checking applications.

April 12, 2026Open Access

Extracting facts from news videos

Key Points

The aim is to develop a method to automatically extract structured facts from news videos for fact-checking applications.
Implemented a prototype for uploading and processing news videos.
Used Microsoft Azure Video Indexer for video and audio data analysis.
Applied natural language processing techniques like named entity recognition and text summarization.
Evaluated the prototype using 31 news videos from the BBC.
Successfully extracted and structured facts about people and events.
Identified issues in recognizing organizations accurately.
Common errors included name misspellings and vague information.

Abstract

Nachrichtenvideos sind eine wichtige Informationsquelle. Ihre schnelle Verbreitung über digitale Plattformen birgt jedoch das Risiko, Fehlinformationen zu verbreiten, und erfordert daher zuverlässige Methoden automatisierter Faktenchecks. Im Unterschied zu textbasierten Nachrichten vereinen Videos gesprochene Sprache, visuelle Elemente und Metadaten, was eine automatische Analyse erschwert. Diese Masterarbeit präsentiert einen Ansatz zur Extraktion strukturierter Fakten aus Nachrichtenvideos, die in weiterer Folge von Faktencheck-Anwendungen verarbeitet werden können. Die Arbeit gibt einen Überblick über den Stand der Forschung im Bereich des automatisierten Faktencheckens sowie der Extraktion von Informationen. Ein besonderer Fokus liegt dabei auf videobasierten Ansätzen. Der entwickelte Prototyp integriert verschiedene Technologien, darunter den Microsoft Azure Video Indexer zur Analyse von Video- und Audiodaten sowie Methoden der natürlichen Sprachverarbeitung wie Named Entity Recognition und extraktive Textzusammenfassung. Das Ergebnis der Arbeit ist eine Pipeline zur Extraktion von Fakten, die Personen, Organisationen und Ereignisse erkennt und verknüpfte Informationen anhand eines Schemas, basierend auf dem schema.org-Standard, strukturiert. Im Zuge dieser Masterarbeit wurde ein Prototyp implementiert, der das Hochladen von Nachrichtenvideos, deren Verarbeitung sowie die Generierung strukturierter Faktenberichte in maschinenlesbarem Format unterstützt. Die Implementierung kombiniert cloudbasierte und lokale NLP-Komponenten, um eine robuste Extraktion der Fakten zu gewährleisten. Für die Evaluation des Prototyps wurden 31 Nachrichtenvideos des Senders BBC analysiert. Anhand der Ergebnisse konnte festgestellt werden, dass Fakten zu Personen und Ereignissen zuverlässig extrahiert und strukturiert werden. Organisationen wurden vom Prototyp jedoch deutlich schlechter erkannt. Häufige Fehlerquellen konnten bei der Schreibweise von Namen, bei zu unspezifischen oder zu allgemein formulierten Informationen sowie bei unpräzisen Zeitangaben festgestellt werden. Diese Masterarbeit präsentiert einen Ansatz zur automatisierten Extraktion von Fakten aus Nachrichtenvideos. Die Ergebnisse der Evaluierung des Prototyps verdeutlichen, in welchen Bereichen Verbesserungsbedarf besteht. Diese beziehen sich vor allem auf die Verarbeitung von Organisationen, die korrekte Extraktion von Informationseinheiten sowie von Zeitdaten. In Zukunft könnte der Fokus auf der Implementierung zusätzlicher Entitätstypen, der optimierten Validierung extrahierter Werte sowie der Integration weiterer Sprachen und Nachrichtenquellen liegen.

Read Full Paperexternally

Bookmark

View Full Paper

Cite This Study

Angelika Eva Kapeller (Thu,) studied this question.

synapsesocial.com/papers/69db37254fe01fead37c51da https://doi.org/https://doi.org/10.25365/thesis.80900

Bookmark

View Full Paper