2015-05-14 6 views
7

साथ ओसीआर के लिए एक छवि साफ़ मेरे पास निम्न छवि है कि मैं Tesseract के साथ एक ओसीआर के लिए तैयार करने के लिए करना चाहते हैं: enter image description hereImageMagick और 'textcleaner'

उद्देश्य छवि को साफ और सभी को दूर करने के लिए है शोर का enter image description here

मैं मापदंडों के लिए लेकिन साथ रूपों के सभी प्रकार की कोशिश की:

./textcleaner -g -e normalize -f 30 -o 12 -s 2 original.jpg output.jpg 

उत्पादन अभी भी बहुत साफ नहीं है: मैं textcleaner स्क्रिप्ट निम्नलिखित मानकों के साथ ImageMagick का उपयोग करता है का उपयोग कर रहा कोई भाग्य नहीं। क्या किसी के पास कोई विचार है?

उत्तर

5

आप में बदलने का तो जेपीईजी, आप हमेशा कलाकृतियों आप देख रहे हैं के प्रकार होगा।

यह जेपीईजी संपीड़न की एक विशिष्ट "विशेषता" है। जेपीईजी छवियों के लिए कभी भी अच्छे नहीं होते हैं जो तेज रेखाएं दिखाते हैं, छवि के विभिन्न क्षेत्रों के बीच समान रंगों के साथ विरोधाभास करते हैं, केवल कुछ ही रंगों का उपयोग करते हैं। यह काले + सफेद ग्रंथों के लिए सच है। जेपीईजी सामान्य तस्वीरों के लिए केवल "अच्छा" है, जिसमें विभिन्न रंग और छायांकन हैं ...

यदि आप पीएनजी आउटपुट प्रारूप के रूप में उपयोग करते हैं तो आपकी समस्या पूरी तरह से हल हो जाएगी। निम्नलिखित छवि यह दर्शाती है। मैं प्रयोग किया जाता है अपने पिछले उदाहरण आदेश के रूप में ही पैरामीटर से उत्पन्न है, लेकिन पीएनजी के साथ उत्पादन प्रारूप के रूप में:

Zoomed PNG

:

textcleaner -g -e normalize -f 30 -o 12 -s 2 \ 
    http://i.stack.imgur.com/ficx7.jpg  \ 
    out.png 

PNG instead of JPEG output

यहाँ उत्पादन में एक समान ज़ूम है

यदि आप textcleaner स्क्रिप्ट के पैरामीटर के साथ खेलते हैं तो आप आउटपुट में भी अधिक सुधार कर सकते हैं। लेकिन यह है नौकरी ... :-)

+1

बहुत धन्यवाद, केवल पीजीजी में जेपीजी को परिवर्तित करके मेरे लिए एक बड़ा अंतर बना दिया, बहुत बहुत धन्यवाद, मुझे पता है कि मेरी टेस्सेक्ट स्क्रिप्ट बहुत बेहतर है! –