January 13, 2003

Große Vokabular natürliche Sprache kontinuierliche Spracherkennung

Key Points

Key points are not available for this paper at this time.

Abstract

Es wird eine Beschreibung der aktuellen Forschung der Autoren zur automatischen Spracherkennung von kontinuierlich gelesenen Sätzen aus einem natürlich vorkommenden Korpus präsentiert: Büro Korrespondenz. Das Erkennungssystem kombiniert Merkmale aus ihrem aktuellen isolierten Wörterkennungssystem und aus ihrem zuvor entwickelten kontinuierlichen Spracherkennungssystem. Es besteht aus einem akustischen Prozessor, einem akustischen Kanalmodell, einem Sprachmodell und einem linguistischen Dekoder. Einige neue Merkmale im Erkenner im Vergleich zum isolierten Wörterkennungssystem umfassen die Verwendung eines schnellen Abgleichs, um schnell auf eine überschaubare Anzahl von Kandidaten zu reduzieren, die vom detaillierten Abgleich berücksichtigt werden, multiple Aussprachen aller Funktionswörter und die Modellierung des interfonischen Koartikulationsverhaltens. Die Autoren nahmen Trainings- und Testdaten von einer Gruppe von zehn männlichen Sprechern auf. Die Verwirrung der TestSätze betrug 93; keiner der Sätze war Teil der Daten, die zur Erstellung des Sprachmodells verwendet wurden. Erste (sprecherabhängige) Erkennungsergebnisse dieser Sprecher ergaben eine durchschnittliche Wortfehlerquote von 11,0 %.

Bookmark

Große Vokabular natürliche Sprache kontinuierliche Spracherkennung

Key Points

Abstract

Cite This Study