2013-02-12 6 views
6

enter image description here मैं स्कैन किए गए दस्तावेज़ से हस्तलिखित डेटा निकालने का सर्वोत्तम तरीका निर्धारित करने का प्रयास कर रहा हूं।छवि पंजीकरण एल्गोरिदम/तकनीक स्कैन किए गए दस्तावेज़ से फ़ील्ड के निष्कर्षण को सक्षम करने के लिए उपयोग की जाती है?

हस्तलिखित डेटा विशिष्ट बॉक्स वाले क्षेत्रों में है। मैंने दस्तावेज़ के डिजिटल संस्करण को उत्पन्न किया, और इसलिए मैं बॉक्स किए गए क्षेत्रों के समन्वय दोनों को जानता हूं, और आवश्यकता होने पर दस्तावेज़ की अतिरिक्त विविधताओं को भी उत्पन्न कर सकता है (यानी एक संस्करण जिसे खेतों को निकालने में आसान बनाने के लिए मुखौटा है)

कारण मैं दस्तावेज उत्पादन से समन्वय का उपयोग करके खेतों को निकालने का कारण नहीं हूं, स्कैनिंग प्रक्रिया के दौरान होने वाले स्थानांतरण/स्केलिंग/परिप्रेक्ष्य में संशोधन होता है, जो प्रत्येक के लिए समन्वय को धक्का/खींच सकता है व्यक्तिगत बॉक्स अलग-अलग (स्कैन किए गए दस्तावेज़ में संरेखण के लिए उपयोग किए जाने वाले कोने मार्कर होते हैं, लेकिन यहां तक ​​कि अनपेक्षित परिवर्तन आमतौर पर होते हैं)।

मुझे लगता है कि उच्च स्तर पर इस मुद्दे को हल करने के दो तरीके हैं: पृष्ठ पर प्रत्येक बॉक्स के समन्वय के माध्यम से कदम उठाएं और उन्हें कुछ तकनीक/एल्गोरिदम के साथ "सही" करने का प्रयास करें, या एक पूर्ण रूप से रिक्त स्थान की तुलना करें फॉर्म (मुखौटा?) और इस तरह सही क्षेत्रों को निकालने का प्रयास करें।

इन संशोधनों के लिए समायोजित करने के लिए सबसे कुशल तकनीक/एल्गोरिदम क्या है और हस्तलेख वाले क्षेत्रों को सटीक रूप से निकालने के लिए क्या है? क्या अन्य विकल्प हैं?

+1

यदि आपका बॉक्स लाइनों से घिरा हुआ है, तो आप इसे आसानी से सहसंबंध या किसी अन्य विधि (आटा ट्रांसफॉर्म इत्यादि) से ढूंढ सकते हैं। बीटीडब्लू, अगर छवि घूर्णन की जा सकती है, तो सहसंबंध आपको खराब परिणाम देगा, लेकिन हफ़ ट्रांसफॉर्म आपको रोटेशन के कोण को निर्धारित करने में मदद करेगा (क्योंकि दस्तावेजों में मुख्य रेखाएं क्षैतिज और लंबवत हैं)। रोटेशन सुधार के बाद आप ऑफसेट निर्देशांक खोजने के लिए वास्तव में एट्लॉन के साथ एक सरल सहसंबंध कर सकते हैं। –

+0

फॉर्म को देखे बिना, मैं बस अनुमान लगा रहा हूं। मेरी आखिरी परियोजना डॉट्स के पैटर्न की पहचान की। डॉट्स के बारे में क्या आसान है, एक बिंदु एक बिंदु है चाहे कोई भी रोटेशन बैठता हो। बिंदुओं के पैटर्न स्थलचिह्न बना सकते हैं, जो सॉफ्टवेयर घूर्णन मूल बिंदु के रूप में उपयोग कर सकते हैं। मूल बिंदु और कोण को जानकर, क्षेत्रों को निकालना आसान है। बिंदुओं का पैटर्न संकल्प को भी इंगित कर सकता है। मैं उलझन में हूं क्यों कोने के निशान केवल 5 डिग्री के भीतर हो सकते हैं। निशान जो दूर हैं उससे कहीं ज्यादा बेहतर करना चाहिए। –

+0

आपके रूपों की कुछ छवियां पोस्ट करने से कुछ समाधान खोजने में मदद मिलेगी। –

उत्तर

0

कई संभावित techniques जो आपकी समस्या के लिए लगभग 100% सटीकता प्राप्त कर सकते हैं।

बस इस पृष्ठ पर वर्णित चरणों का पालन करें http://www.codeproject.com/Articles/24809/Image-Alignment-Algorithms। संक्षेप में, आप पहले दो छवियों के बीच ऑप्टिकल प्रवाह की गणना करते हैं और फिर ऐसे ऑप्टिकल प्रवाह का उत्पादन करने वाले रूपांतरण का अनुमान लगाते हैं।

नोट: मिलान की गई छवियां लगभग समान होने पर यह दृष्टिकोण सबसे अच्छा काम करता है।

संबंधित मुद्दे

 संबंधित मुद्दे