Key points are not available for this paper at this time.
एक OCR प्रणाली का प्रस्ताव किया गया है जो दो भारतीय भाषा स्क्रिप्ट: बांग्ला और देवनागरी (हिंदी) पढ़ सकती है, जो भारतीय उपमहाद्वीप में सबसे लोकप्रिय हैं। ये स्क्रिप्ट, जो प्राचीन ब्राह्मी स्क्रिप्ट से समान उत्पत्ति रखती हैं, में कई सामान्य विशेषताएँ हैं और इसलिए उन्हें पहचानने के लिए एक ही प्रणाली का मॉडेल बनाया जा सकता है। प्रस्तावित मॉडल में, दस्तावेज़ डिजिटलीकरण, झुकाव पहचान, टेक्स्ट लाइन विभाजन और क्षेत्र विभाजन, शब्द और वर्ण विभाजन, मूल, परिवर्तक और युग्म वर्ण श्रेणी में वर्णों का समूह बनाना दोनों स्क्रिप्टों के लिए एक ही एल्गोरिदम के सेट द्वारा किया जाता है। विशेषताओं के सेट और वर्गीकरण वृक्ष के साथ ही त्रुटि सुधार के लिए आवश्यक ज्ञान आधार (जैसे, शब्दकोश) बांग्ला और देवनागरी के लिए भिन्न होते हैं। प्रणाली स्पष्ट दस्तावेज़ों पर मुद्रित एकल फ़ॉन्ट स्क्रिप्ट के लिए अच्छा प्रदर्शन दिखाती है।
चौधरी एट अल। (शुक्रवार,) ने इस प्रश्न का अध्ययन किया।