January 1, 1993

音声のためのマルコフモデル構築法

Key Points

Key points are not available for this paper at this time.

Abstract

単語の音響表現のためのマルコフモデルを構築する技術について説明します。単語モデルは、フェノンと呼ばれるサブワードユニットのモデルから構築されます。フェノンは非常に短いスピーチイベントを表し、ベクトル量子化器を使用して自動的に取得されます。単語のフェノニックベースフォーム、すなわちその単語を表すために使用されるフェノンの列は、その単語の1つ以上の発話から自動的に導出されます。単語モデルはすべて小さなサブワードモデルの在庫から構成されているため、大規模語彙の音声認識システムのトレーニングは小さなトレーニングスクリプトで実施できます。音声学モデルとフェノンモデルを組み合わせる方法を提示します。いくつかの孤立単語認識タスクにおける話者依存および話者非依存モデルの実験結果が報告されます。結果は音声学ベースのマルコフモデルやテンプレートベースの動的計画法（DP）マッチングの結果と比較されています。

AIに質問

Bookmark