2010-01-31 8 views
57

क्या कोई निःशुल्क ओसीआर पुस्तकालय है जो लिनक्स सर्वर पर PHP या पायथन के साथ काम करता है? विचार एक छवि अपलोड करने और उससे अक्षर खींचने में सक्षम होना है, या उपयोगकर्ताओं को "अक्षर खींचने" की अनुमति देना है, और उन्हें छवि के बाहर पार्स करना है।PHP का उपयोग कर वेबसाइट पर ओसीआर कैसे कार्यान्वित कर सकता हूं?

उत्तर

31

चूंकि आप एक लिनक्स बॉक्स पर हैं, इसलिए मैं अत्यधिक Google की ओपन सोर्स प्रोजेक्ट ocropus की अनुशंसा करता हूं।

यह PHP नहीं है, लेकिन मुझे लगता है कि यह आपका सबसे अच्छा विकल्प होगा। बेशक आप इसे exec के माध्यम से PHP के भीतर से कॉल कर सकते हैं। यह परिपक्व है और इसमें बहुत सारे विकल्प हैं।

OCRopus इंजन दो अनुसंधान परियोजनाओं पर आधारित है:: एक उच्च प्रदर्शन लिखावट के मध्य 90 में विकसित किया है और अमेरिकी जनगणना ब्यूरो द्वारा तैनात पहचानकर्ता, और उपन्यास उच्च प्रदर्शन लेआउट विश्लेषण विधियों परियोजना स्थल से।

एक और ओपन सोर्स प्रोजेक्ट, tesseract भी है। मैंने इसे अतीत में भी इस्तेमाल किया है और परिणामों से प्रसन्न हूं। प्रशिक्षण शामिल है, आपके वर्णमाला को सीमित करना, आदि

+0

पॉइंटर के लिए धन्यवाद। मैं आपको बता दूंगा कि वे कैसे जाते हैं। धन्यवाद! – Moshe

+0

अभी तक इसे अभी तक नहीं मिला है ... यह एक ऐसे ग्राहक के लिए था जिसने परियोजना को थोड़ी देर के लिए बैक बर्नर पर रखने की आवश्यकता थी ... – Moshe

5

क्या आपने एंड्री कुचेरेन्को के phpOCR कक्षाएं देखी हैं? http://www.phpclasses.org/package/2874-PHP-Recognize-text-objects-in-graphical-images.html यह एक पुराना लेख है लेकिन आपकी मदद कर सकता है।

+0

यदि यह वास्तव में काम करता है, तो ऐसा लगता है कि यह एक साधारण मैच है (इसलिए मुझे लगता है अक्षरों को "सीखा" वाले के साथ समान होना होगा)। लेकिन यह कुछ स्थितियों में चाल कर सकता है, और इसके शीर्ष पर कुछ विकसित करने के लिए एक अच्छा प्रारंभिक बिंदु जैसा लगता है। – Quamis

संबंधित मुद्दे

 संबंधित मुद्दे