March 1, 1987

Zur Erkennung von gedruckten Zeichen beliebiger Schriftarten und Größen

Key Points

Key points are not available for this paper at this time.

Abstract

Wir beschreiben den aktuellen Stand eines Systems, das gedruckten Text verschiedener Schriftarten und Größen des lateinischen Alphabets erkennt. Das System kombiniert mehrere Techniken, um die Gesamtgenauigkeit der Erkennung zu verbessern. Verdünnung und Formenextraktion werden direkt auf einem Graphen der Run-Length-Encoding einer binären Abbildung durchgeführt. Die resultierenden Striche und anderen Formen werden unter Verwendung eines Ansatzes zur Formenclustering in binäre Merkmale umgewandelt, die dann einem statistischen Bayes-Klassifizierer zugeführt werden. Großangelegte Versuche haben eine Korrektheit von mehr als 97 Prozent beim besten Treffer bei Mischungen aus sechs unterschiedlichen Schriftarten gezeigt und über 99 Prozent bei den meisten einzelnen Schriftarten über eine Reihe von Punktgrößen. Bestimmte verbliebene Verwechslungsarten werden durch Konturanalyse aufgeklärt, und Zeichen, die verdächtigt werden, zusammengeführt worden zu sein, werden getrennt und neu klassifiziert. Schließlich werden Layout und sprachlicher Kontext angewendet. Die Ergebnisse werden durch Beispielseiten veranschaulicht.

KI fragen

Bookmark