Key points are not available for this paper at this time.
Zusammenfassung In letzter Zeit wurden Vorlesungsvideos in E-Learning-Systemen weit verbreitet. Mit dem Ziel, intelligente E-Learning-Systeme zu entwickeln, behandelt dieser Artikel die Herausforderung der Informationssuche in Vorlesungsvideos, indem relevante Videosegmente basierend auf Nutzeranfragen durch dynamische Segmentierung von Vorlesungstexten abgerufen werden. In dem vorgeschlagenen Ansatz werden flache Parsing-Methoden wie Part-of-Speech-Tagging und Chunking von Nominalphrasen verwendet, um sowohl Fragen als auch Transkripte von automatischer Sprach- erkennung (ASR) zu parsen. Ein Sliding-Window-Algorithmus wird vorgeschlagen, um die Start- und Endgrenzen der zurückgegebenen Segmente zu identifizieren. Phonetik und partielle Übereinstimmung werden genutzt, um die Fehler aus der automatischen Sprach- erkennung und dem Chunking von Nominalphrasen zu korrigieren. Darüber hinaus werden zusätzliche Kenntnisse wie Vorlesungsfolien verwendet, um die Fehlerkorrektur des ASR-Transkripts zu erleichtern. Der Ansatz nutzt auch die Nähe, um das tiefe Parsing und die Strukturübereinstimmung zwischen Fragen und Sätzen in ASR-Transkripten zu approximieren. Die experimentellen Ergebnisse zeigten, dass sowohl phonetic als auch partielle Übereinstimmung die Segmentierungsleistung verbesserte, die folienbasierte ASR-Transkriptkorrektur die Informationsabdeckung verbessert und die Nähe ebenfalls effektiv zur Verbesserung der Gesamtleistung beiträgt.
Lin et al. (Tue,) untersuchten diese Frage.