November 22, 2002

दो भारतीय भाषा स्क्रिप्ट पढ़ने के लिए एक OCR प्रणाली: बांग्ला और देवनागरी (हिंदी)

Key Points

Key points are not available for this paper at this time.

Abstract

एक OCR प्रणाली का प्रस्ताव किया गया है जो दो भारतीय भाषा स्क्रिप्ट: बांग्ला और देवनागरी (हिंदी) पढ़ सकती है, जो भारतीय उपमहाद्वीप में सबसे लोकप्रिय हैं। ये स्क्रिप्ट, जो प्राचीन ब्राह्मी स्क्रिप्ट से समान उत्पत्ति रखती हैं, में कई सामान्य विशेषताएँ हैं और इसलिए उन्हें पहचानने के लिए एक ही प्रणाली का मॉडेल बनाया जा सकता है। प्रस्तावित मॉडल में, दस्तावेज़ डिजिटलीकरण, झुकाव पहचान, टेक्स्ट लाइन विभाजन और क्षेत्र विभाजन, शब्द और वर्ण विभाजन, मूल, परिवर्तक और युग्म वर्ण श्रेणी में वर्णों का समूह बनाना दोनों स्क्रिप्टों के लिए एक ही एल्गोरिदम के सेट द्वारा किया जाता है। विशेषताओं के सेट और वर्गीकरण वृक्ष के साथ ही त्रुटि सुधार के लिए आवश्यक ज्ञान आधार (जैसे, शब्दकोश) बांग्ला और देवनागरी के लिए भिन्न होते हैं। प्रणाली स्पष्ट दस्तावेज़ों पर मुद्रित एकल फ़ॉन्ट स्क्रिप्ट के लिए अच्छा प्रदर्शन दिखाती है।

AI से पूछें

Bookmark

AI से पूछें

Bookmark

दो भारतीय भाषा स्क्रिप्ट पढ़ने के लिए एक OCR प्रणाली: बांग्ला और देवनागरी (हिंदी)

Key Points

Abstract

Cite This Study