Key points are not available for this paper at this time.
Die drei Aspekte eines statistischen Ansatzes für ein Mustererkennungsproblem sind die Auswahl von Merkmalen, die Wahl eines Maßes für Ähnlichkeit und eine Methode zur Erstellung der Referenzvorlagen (Muster), die in den statistischen Tests verwendet werden. Dieses Papier diskutiert eine Philosophie zur Erstellung von Referenzvorlagen für ein sprecherunabhängiges System zur Erkennung isolierter Wörter. Obwohl viele unbeantwortete Fragen sowohl zur Auswahl geeigneter Merkmale für die Erkennung als auch zur Messung der Ähnlichkeit zwischen Merkmalsätzen bestehen, werden solche Fragen hier nicht behandelt. Stattdessen konzentrieren wir uns auf Methoden zur Erstellung der Referenzvorlagen. Insbesondere wird eine Methode vorgeschlagen, bei der Wortmuster von einer Anzahl von Sprechern kombiniert werden, wobei eine Analyse vom Typ Clustering verwendet wird, um zu bestimmen, welche Muster zusammengeführt werden, um eine Wortvorlage zu erstellen. Die Erstellung mehrerer Vorlagen auf Basis dieser Methode wird erörtert und zeigt sich als von erheblichem Wert für bereits acht Sprecher im Trainingssatz. Um die hier vorgeschlagenen Ideen zu testen, wurde ein System zur Erkennung von 54 Wörtern implementiert. Alle eingegebenen Wörter wurden über eine Standardtelefonleitung aufgenommen. Die verwendeten Merkmale waren die LPC-Koeffizienten einer 8-poligen Analyse, und das einfache Itakura-Distanzmaß wurde verwendet, um die Ähnlichkeit zwischen den Mustern zu messen. Mit den oben beschriebenen Wortvorlagen wurden in einem erzwungenen Erkennungstest mit dem 54-Wörter-Wortschatz bei acht neuen Sprechern Erkennungsgenauigkeiten von 85 Prozent erzielt. Das korrekte Wort war 98 Prozent der Zeit unter den fünf besten Auswahlmöglichkeiten. Bei einer Strategie, bei der alle Trainingswörter zur Erstellung der Vorlagen verwendet wurden, fiel die Erkennungsgenauigkeit auf 77 Prozent, und das korrekte Wort war nur 89 Prozent der Zeit unter den fünf besten Auswahlmöglichkeiten.
L. R. Rabiner (Wed,) untersuchte diese Frage.