2009-11-01 8 views
8

यह वास्तव में नहीं है, क्योंकि यह पात्रों को पहचानने नहीं कर रहा है कि "ओसीआर", है, लेकिन यह एक ही विचार घटता के लिए आवेदन किया है। किसी को भी एक (रास्टर) साजिश छवि से मूल्यों को पुनर्प्राप्त करने के लिए एक छवि प्रसंस्करण पुस्तकालय या स्थापित एल्गोरिदम के बारे में पता है? उदाहरण के लिए, इस ग्राफ में, यह मुश्किल है ग्रिडलाइनें के बीच इस तरह के अंतराल है, क्योंकि मुझे मेरी आँखों से सटीक मान को पढ़ने के लिए:प्लॉट डिजिटलीकरण - एक ग्राफ की एक छवि से नमूना मूल्यों scraping

alt text http://i35.tinypic.com/316airl.jpg

मैं एक सीधा किनारा या जो कुछ भी उपयोग कर सकते हैं, लेकिन यह अभी भी त्रुटि हो रहा है -prone। यह बहुत अच्छा होगा अगर सॉफ़्टवेयर था जो किसी भी पुराने ग्राफ का स्क्रीनशॉट ले सकता है और इसे स्वचालित रूप से मानों की एक तालिका या एक फ़ंक्शन में परिवर्तित कर सकता है जिसे पूछताछ की जा सकती है।

"वक्र मान्यता" कहा जाने लगता है? वैज्ञानिक कागजात में वक्र से डेटा निकालने के लिए भी इस्तेमाल किया जा सकता है जिसके लिए अंतर्निहित डेटा प्रकाशित नहीं होता है।

और यह कुछ मानव मार्गदर्शन करने के लिए ठीक है। ऐसा कोई कारण नहीं है कि ओसीआर "100" नहीं पढ़ सके और लाइन के साथ इसे मैच के साथ मेल नहीं कर सकता है, लेकिन यह ठीक है कि मशीन ने ग्रिडलाइन के सापेक्ष वक्र के पथ को निकालने के बाद संख्याओं को संख्यात्मक मान दिया है। मैं ज्यादातर ग्रिड के सापेक्ष वक्र का पता लगाने के कार्य में रूचि रखता हूं, भले ही ग्रिड झुका हुआ, घुमाया गया हो, या warped in a non-affine way

अद्यतन:

अब एक विकिपीडिया लेख लिंक में सॉफ्टवेयर के एक समूह के साथ Converting scanned graphs to data कहा जाता है। इसके अलावा कुछ software on alternativeto.net। मुझे लगता है कि सिद्धांत अब http://dsp.stackexchange.com पर है, जबकि सॉफ्टवेयर समाधान http://superuser.com पर हैं?

+0

मैंने उपयोग किया है http://arohatgi.info/WebPlotDigitizer/ को ग्राफ के कुछ मैन्युअल एनोटेशन की आवश्यकता है, लेकिन आपके मामले में मुझे लगता है कि यह सबसे आसान विकल्प है! –

+1

@ रasmसबाथ: हाँ, जो मैं उपयोग कर रहा हूं। यह एक प्रोग्रामिंग सवाल है, हालांकि। – endolith

उत्तर

5

यह बहुत कठिन और त्रुटि प्रवण है। (हम इस तरह की चीज रसायन शास्त्र में करते हैं जहां हम रसायन शास्त्र का विश्लेषण करने की कोशिश करते हैं।) यह विभिन्न मानकों और शर्तों पर गंभीर रूप से निर्भर करता है।

  1. क्या छवि एक बिट-मैप (पिक्सल-केवल) या वैक्टर (ईएमएफ, डब्लूएमएफ, एसवीजी, पीएस, पीडीएफ ...) है? वेक्टर पिक्सल की तुलना में काफी बेहतर हैं। हम वैक्टर से निपटते हैं (पीडीएफ सहित) लेकिन पिक्सल को स्पर्श न करें। हमारे कुछ collbaorators पिक्सल का उपयोग करने की कोशिश करेंगे, लेकिन केवल हाल के दस्तावेजों पर।
  2. यदि आप पिक्सल के साथ फंस गए हैं तो क्या आपकी छवियां एक ही स्रोत से हैं? यदि ऐसा है तो आपके पास फ़ॉन्ट जानकारी निकालने का एक छोटा सा मौका है। मुझे डर है कि आपकी छवि इतनी खराब है कि इसे बहुत काम की आवश्यकता होगी। हालांकि यदि आप फ़ॉन्ट को काम कर सकते हैं तो आपके पास टेक्स्ट और नंबर निकालने का मौका है यदि सभी दस्तावेज़ एक ही स्रोत से हैं। आप हेरिस्टिक्स (नियमों जैसे कि संख्याएं हो सकती हैं) या मशीन-लर्निंग (विधियों को प्रशिक्षित किया जा सकता है पर सुविधाओं की एक सूची) का उपयोग कर सकते हैं।
  3. आपकी छवि स्कैन की गई प्रतीत होती है (क्योंकि axes pixelated हैं)। इससे इससे भी बदतर हो जाता है। क्या लगता है कि आंखों की सीधी रेखा एक मशीन के लिए भयानक है। क्या आपकी छवि पृष्ठ पर तिरछी है? आपको इसे पेश करना पड़ सकता है।
  4. यदि आपके पास लाइनों और घटता के लिए एक मॉडल है तो आपके पास छवि में अपेक्षित मानकों को मॉडलिंग में बदलाव हो सकता है। लेकिन यह तुच्छ नहीं है।

मैं निराशावादी होने के लिए माफी चाहता हूँ। यदि आप वास्तव में जानकारी चाहते हैं तो यह समूह के साथ बहुत सारे निवेश या सहयोग के साथ किया जा सकता है जो इस तरह की चीज करता है।

+0

मुझे नहीं लगता कि यह उतना कठिन है जितना आप कल्पना करते हैं। इसके साथ आपके पास क्या विशिष्ट अनुभव है? मुझे समझ में नहीं आता कि "रसायन शास्त्र का विश्लेषण" के साथ क्या स्क्रैपिंग ग्राफ करना है। – endolith

+0

और हाँ, मेरा मतलब है रास्टरराइज्ड ग्राफ, वेक्टर छवियों नहीं। – endolith

+0

@endolith उपरोक्त ग्राफ एक रसायन शास्त्र पेपर में अच्छी तरह से दिखाई दे सकता है। वैज्ञानिक पत्रों से जानकारी निकालने के तरीके पर हमने विश्लेषण किया है (और सहकर्मी-पुनर्नवीनी पत्रिकाओं में प्रकाशित)। ये मुख्य रूप से रसायन शास्त्र में होते हैं लेकिन उनमें ग्राफ होते हैं जो इस समस्या के सभी पहलुओं को दिखाते हैं। आप "ऐसा नहीं सोचते कि यह उतना कठिन है जितना मैं कल्पना करता हूं"। यदि आपने वास्तव में दिखाए गए चित्र से सूचना (मानव सहायता के बिना) निकालने से सॉफ्टवेयर लिखने में कामयाब रहे हैं तो आप बहुत से लोगों को आश्चर्यचकित करेंगे। –

1

मुझे लगता है कि तुम क्या कह रहे हैं करता है किसी भी सॉफ्टवेयर के बारे में पता नहीं है, लेकिन आप कुछ ही अंक प्राप्त कर सकते हैं अगर आप सबसे अच्छा कार्य है जो उन बिंदुओं फिट बैठता है खोजने के लिए प्रतिगमन किसी तरह का उपयोग कर सकते हैं।यह विशेष ग्राफ एक घातीय कार्य की तरह दिखता है। तो आप एक घातीय प्रतिगमन कैलक्यूलेटर खोजना चाहते हैं। "वक्र मान्यता सॉफ्टवेयर" के लिए

+0

कृपया हमें बताएं कि "रिग्रेशन कैलक्यूलेटर" छवि से डेटा कैसे पढ़ सकता है? –

3

गूगल पता चलता है http://www.curveunscan.com/

+0

हम्म ... यह कहता है "वक्र मान्यता एल्गोरिदम", लेकिन हाथों से अंक चुनने के बारे में भी बात करता है: http://www.curveunscan.com/features.htm – endolith

+0

यह काम करता है, लेकिन बहुत सारे हाथ लेने की आवश्यकता है अंक, ट्रैक वक्र खराब, और अक्सर दुर्घटनाओं। :/ – endolith

+0

यहां कुछ वक्र सॉफ़्टवेयर समाधान है, कुछ वक्र निम्न क्षमता के साथ: http://digitizer.sourceforge.net/ – endolith

2

वहाँ भी है potrace जो संबंधित है, और बदले में उस पृष्ठ अन्य विकल्प

उल्लेख
1

मैं ग्राफ छवियों को डेटा में कनवर्ट करने के लिए im2graph का उपयोग करता हूं, यानी, संख्याएं। im2graph निःशुल्क है और लिनक्स और विंडोज के लिए उपलब्ध है। बहुत चिकनी और परिणाम उत्पन्न करने के लिए आपके हिस्से पर बहुत कम प्रयास की आवश्यकता है। http://www.im2graph.co.il

संबंधित मुद्दे