मैं पाइथन के साथ एक ओसीआर प्रोग्राम को कार्यान्वित करने का प्रयास कर रहा हूं जो विशिष्ट प्रारूप, XXX-XXX के साथ संख्याओं को पढ़ता है। मैंने Google की क्लाउड विजन API टेक्स्ट पहचान का उपयोग किया, लेकिन परिणाम अविश्वसनीय थे। 30 उच्च-विपरीत 1280 x 1024 बीएमपी छवियों में से, केवल एक मुट्ठी भर सही आउटपुट में परिणामस्वरूप, या कम से कम परिणामों में सही आउटपुट शामिल किया गया। कार्यक्रम कुछ संख्याओं को छोड़ देता है, गैर-अंग्रेजी भाषाओं में आउटपुट या कुछ विशेष पात्रों में छेड़छाड़ करता है।Google क्लाउड विजन - संख्याएं और अंक OCR
लक्ष्य कम से कम सही संख्याओं को कम से कम आउटपुट करना है, इससे कोई फर्क नहीं पड़ता कि परिणाम अन्य जंक के साथ छिड़के जाते हैं। प्रोग्राम को संख्याओं को बेहतर पहचानने में मदद करने का कोई तरीका है, उदाहरण के लिए परिणामों को किसी विशिष्ट प्रारूप में सीमित करें, या केवल संख्याओं तक सीमित करें?