Key points are not available for this paper at this time.
サブワードクラスタリングのために2つの方法が提案されています。最初の方法は凝集クラスタリングアルゴリズムです。この方法は完全にデータ駆動であり、外部の指導なしにクラスタを見つけます。2番目の方法は、クラスタリングのために決定木を使用します。この方法は、文脈に関する専門家が作成した質問リストを使用し、再帰的に最も適切な質問を選択して異音素を分割します。予備結果は、トレーニングセットにテストセットの異音素の変種の良いカバレッジがある場合、どちらの方法も高性能な認識が可能であることを示しました。しかし、語彙に依存しない条件下では、木ベースの異音素を使用する方法が、優れた一般化能力のために凝集クラスタリングよりも優れていました。
Lee et al. (水曜日) はこの問題を研究しました。