Key points are not available for this paper at this time.
Der robuste HMM-Erkenner von Lincoln wurde von einer einzelnen Gauß- oder Gaußmischungs-pdf pro Zustand auf gebundene Mischungen umgestellt, bei denen ein einziger Satz von Gaußs zwischen allen Zuständen geteilt wird. Es gab einige anfängliche Schwierigkeiten, die durch die Verwendung von Mischungsbeschneidung verursacht wurden, aber diese wurden durch die Verwendung von Beobachtungsbeschneidung behoben. Eine feste Gewichtsglättung der Mischungsgewichte ermöglichte die Verwendung von kontextabhängigen Triphon-Modellen für sowohl sprecherabhängige (SD) als auch sprecherunabhängige (SI) Erkennung. Ein zusätzlicher Differenzial-Bestream verbesserte die SI-Leistung weiter, jedoch nicht die SD-Leistung. Die Gesamterkennungsleistung für sowohl SI- als auch SD-Training entspricht der besten berichteten im Einklang mit dem Ressourcenmanagement-Testset von Oktober 89. Eine neue Form des phonetischen Kontextmodells, das Semiphone, wird ebenfalls eingeführt. Dieses neue Modell reduziert die Anzahl der benötigten Zustände zur Modellierung eines Wortschatzes erheblich.
Douglas B. Paul (Mon,) untersuchte diese Frage.