2012-04-20 10 views
5

मैं हस्तलिखित पर संपर्क जानकारी (यानी नाम, पता, फोन, ईमेल इत्यादि) स्कैन किए गए प्रतिक्रिया पोस्टकार्डों का एक समूह संसाधित करना चाहता हूं।क्या कोई व्यवहार्य हस्तलेख मान्यता पुस्तकालय/कार्यक्रम है?

मैं उत्सुक हूँ अगर वहाँ एक व्यवहार्य खुला स्रोत पुस्तकालय या सॉफ्टवेयर का टुकड़ा यह करने के लिए (आदर्श जावा या आर) है। बहुत सारी जानकारी देखने में 200 9 या उससे पहले की शुरुआत है और यह बहुत उत्साहजनक नहीं है।

भाषा अंग्रेजी है।

कोई सुझाव?

संपादित करें: मैं OCRopus पेज को देखा है, लेकिन नवीनतम संस्करण मई से 2009 कोई भी इस के साथ किसी भी अनुभव है या वहाँ अधिक नया संस्करण है?

+0

किसी विशेष भाषा? –

+1

मुझे वास्तव में इस प्रश्न में टैगिंग नहीं मिलती है ... – talnicolas

+0

@DanW: जावा या आर आदर्श होगा। हस्तलेख अंग्रेजी में है। – screechOwl

उत्तर

2

से शुरू करने के लिए तकनीक की जांच करने की सिफारिश करता हूं, जहां तक ​​मुझे पता है कि कोई मूल ओपनसोर्स जावा ओसीआर एसडीके नहीं है। जावा एपीआई हैं जो देशी इंटरफेस के लिए कॉल लपेटती हैं, tesjeract (http://code.google.com/p/tesjeract/) या टेस 4 जे (http://tess4j.sf.net/)।

अगला, आपको यह निर्दिष्ट करने की आवश्यकता है कि क्या आप हस्तलिखित या हैंडप्रिंट किए गए टेक्स्ट की तलाश में हैं। अगर आपको हस्तलेखन पाठ पहचान की आवश्यकता है - मैं निराश नहीं हूं, तो आप अन्य कार्यों में बताए गए कारणों के कारण अपने कार्यों को हल करने में सक्षम होंगे।

हालांकि, अगर आप handprinted पाठ के लिए आईसीआर (कि बुद्धिमान वर्ण पहचान के लिए खड़ा है) की जरूरत है (न कि स्पष्ट पत्र सर्वेक्षण, रूपों, आदि में प्रयुक्त) वहाँ एक समाधान हो सकता है। मुझे लगता है कि Tesseract मानना ​​है कि एक ओर जहां (ओपनसोर्स इंजन के बीच सबसे अच्छा माना जा रहा बावजूद) यहाँ आप के लिए काम नहीं करेंगे, तो आप और अधिक सटीक SDKs लिए देख सकते हैं।

हो सकता है कि इस सवाल का मदद मिलेगी: Handwritten scanned Doc to .txt File?

3

आप http://code.google.com/p/ocropus/ पर देख सकते हैं, जो एक ओपन-सोर्स ओसीआर सिस्टम है।

लेकिन, यह C++ में लिखा गया था और अजगर प्रतीत होता है।

* अद्यतन: *

के बाद से अनुसंधान परियोजनाओं में से एक एक हस्तलिखित विश्लेषक मैं इसे मदद मिल सकती है उम्मीद है। एक उच्च प्रदर्शन लिखावट के मध्य 90 के और अमेरिकी जनगणना ब्यूरो द्वारा तैनात में विकसित पहचानकर्ता, और उपन्यास उच्च प्रदर्शन लेआउट विश्लेषण विधियों:

OCRopus इंजन दो अनुसंधान परियोजनाओं पर आधारित है।

और अगर आप http://code.google.com/p/ocropus/source/browse/ पर देखने के स्रोत फ़ाइलों के बाद से 10/2011 (तीन में से एक 3/2012 से किया गया था) को अद्यतन किया गया है, तो यह अभी भी विकास के अंतर्गत वर्तमान में प्रतीत होता है।

+0

ओसीरोपस हस्तलेख मान्यता के लिए नहीं है – Tomato

3

मुझे किसी भी कामकाजी ओपन सोर्स हस्तलेख मान्यता पुस्तकालय के बारे में पता नहीं है, भले ही मैं पहले से ही ओसीआर स्पेस में हूं। आम तौर पर हस्तलेखन ओसीआर की तुलना में अधिक कठिन है और मैं कहूंगा कि यहां तक ​​कि सभ्य व्यावसायिक समाधान भी नहीं है। मौजूद सभी के पास अपने स्वयं के मुद्दे हैं और केवल सीमित संकीर्ण अनुप्रयोगों में काम कर सकते हैं जैसे कि शब्दकोश सीमित है, पाठ अच्छी तरह से लिखा गया है, आदि। यदि आप अभी भी रुचि रखते हैं तो मैं फ्रेंच कंपनी आई 2आईए

संबंधित मुद्दे