July 19, 1996Open Access

Anwendung von Winnow zur kontextsensitiven Rechtschreibkorrektur

Key Points

Key points are not available for this paper at this time.

Abstract

Multiplikative Gewichtsanpassungsalgorithmen wie Winnow wurden in der COLT-Literatur eingehend untersucht, aber erst kürzlich haben Menschen begonnen, sie in Anwendungen zu verwenden. In diesem Papier wenden wir einen auf Winnow basierenden Algorithmus auf eine Aufgabe in der natürlichen Sprache an: die kontextsensitive Rechtschreibkorrektur. Dies ist die Aufgabe, Rechtschreibfehler zu beheben, die zufällig zu gültigen Wörtern führen, wie z.B. die Substitution von to\/ für too, casual\/ für causal und so weiter. Frühere Ansätze zu diesem Problem basierten auf Statistik; wir vergleichen Winnow mit einem der erfolgreicheren Ansätze, der Bayessche Klassifizierer verwendet. Wir stellen fest, dass: (1) ~Wenn der Standard (stark gestutzte) Merkmalsatz verwendet wird, um Problemfälle zu beschreiben, schneidet Winnow vergleichbar mit der Bayesian-Methode ab; (2) ~Wenn der vollständige (nicht gestutzte) Merkmalsatz verwendet wird, kann Winnow die neuen Merkmale nutzen und übertrifft Bayes überzeugend; und (3) ~Wenn ein Testset auftritt, das sich vom Trainingsset unterscheidet, ist Winnow besser als Bayes darin, sich an das unbekannte Testset anzupassen, wobei wir eine Strategie präsentieren werden, um das Lernen am Trainingsset mit unüberwachtem Lernen am (rauschenden) Testset zu kombinieren.

KI fragen

Bookmark

View Full Paper