मैं एक उत्तर पेपर अंकन (एकाधिक विकल्प प्रश्न) पायथन एप्लिकेशन बनाने की कोशिश कर रहा हूं। उत्तर पत्र छवि फ़ाइल में स्कैन किया जाएगा (gif, png, jpg, जो भी प्रारूप आवश्यक है)।पायथन ओसीआर: प्रसंस्करण के लिए पाठ में स्कैन की गई छवि को परिवर्तित करना
मेरी ऐप में डेटाबेस तक पहुंच है जहां सभी उत्तरों संग्रहीत हैं।
तो, स्कैन की गई छवि से किसी प्रकार का डेटा चाहिए ताकि यह उत्तर की तुलना कर सके और अंकों की गणना कर सके। ,
इंटरनेट के माध्यम से खोज करने के बाद मैं:
उत्तर पुस्तिका (उत्तर 'एक्स' से चिह्नित होंगे उम्मीदवार द्वारा उनके जवाब से संकेत मिलता है) इस तरह की मेज प्रारूप के साथ आयाम तय किया है पाया कि कुछ ओसीआर एपीआई उपलब्ध हैं।
पहला वाला Pytesser
है। इसका उपयोग करना बहुत आसान है और परिणाम काफी ठीक हैं। लेकिन यह केवल शुद्ध ग्रंथों वाली छवियों के लिए काम करता है। तो, मुझे लगता है कि यह उपयुक्त नहीं है।
मुझे मिला दूसरा दूसरा Ocropus
है। यह शक्तिशाली लगता है, लेकिन उस में प्रलेखन
विंडोज
OCRopus POSIX पथ नाम और फाइल सिस्टम पर बहुत कुछ निर्भर करता है है। आप विंडोज पर ओसीरोपस स्थापित करने में सक्षम हो सकते हैं। एक आसान तरीका वर्चुअलबॉक्स को स्थापित करना और वर्चुअलबॉक्स के तहत उबंटू में ओसीरोपस चलाएं।
तो मुझे लगता है कि यह ज्यादातर लिनक्स के लिए है। मुझे विंडो प्लेटफार्म के लिए एक विस्तार स्थापना गाइड नहीं मिला। (मैं एक नौसिखिया हूं, इसलिए मैं गलत हो सकता हूं)
मुझे मिला तीसरा python-tesseract
है, Tesseract OCR
के लिए एक रैपर है। उनके page में, स्थापना मार्गदर्शिका प्रदान की गई थी। असल में, मैं की जरूरत है,
- अजगर-Tesseract-win32.deb
- अजगर-opencv
- numpy
लेकिन मैं कैसे खिड़की पर .deb
फ़ाइलें स्थापित करने के लिए पर कोई सुराग नहीं है। मेरे पास opencv
और nampy
पहले से स्थापित है।
तो निम्नलिखित मेरे सवालों हैं:
(1) जो रास्ते में मैं processable डेटा में तालिका छवि (यह भी संभव है?) में बदल सकते हैं?
(2) क्या कोई अन्य उपयोगी ओसीआर एपीआई है जिसका मैंने यहां उल्लेख नहीं किया है जो उपयोगी हो सकता है?
(3) अंत में, (मेरी मूर्खतापूर्ण विचार) यह छोटे chucks में छवि को विभाजित करना संभव है - PIL
का उपयोग कर और फिर pytesser
का उपयोग प्रत्येक कन्वर्ट करने के लिए (तालिका कोशिकाओं के आकार के आधार पर के बाद से तालिका आयाम में जाना जाता है) पाठ में छोटी छवियां, उसके बाद डेटा को तदनुसार संसाधित करें?
एफवाईआई: मुझे केवल विंडोज़ प्लेटफार्म के लिए इसकी आवश्यकता है, संभवतः विंडोज़ XP 32 बिट्स के लिए। मैं अजगर 2.7.5 का उपयोग कर रहा हूँ।
.deb लिनक्स डीबैन/उबंटू पैचेज फाइलें हैं, आप मूल रूप से विंडोज़ पर उनको इंस्टॉल नहीं करते हैं। – McAbra