के स्कैन का पता लगाने के लिए पीआईएल का उपयोग करना, इसलिए मैं अक्सर एक अनजान कैनन मल्टीफंक्शन पर बड़ी डबल-पक्षीय स्कैन नौकरियां चलाता हूं, जो मुझे जेपीईजी के एक विशाल फ़ोल्डर के साथ छोड़ देता है। क्या मैं रिक्त पृष्ठों के स्कैन का पता लगाने और उन्हें हटाने के लिए ध्वजांकित करने के लिए छवियों के फ़ोल्डर का विश्लेषण करने के लिए पीआईएल का उपयोग करने पर विचार करने के लिए पागल हूं?रिक्त पृष्ठ
फ़ोल्डर-रेंगने छोड़कर और भागों बाहर पर चिह्नित करने, मैं कल्पना कुछ इस तरह दिखेगा:
- जांच करें कि छवि, ग्रेस्केल है के रूप में इस अनिश्चित माना जाता है।
- यदि ऐसा है, तो रंगों की पृष्ठभूमि (पृष्ठभूमि रंग) का पता लगाएं।
- यदि नहीं, तो हल्के ग्रेज़ को प्रतिबंधित करने वाले रंगों की प्रमुख श्रृंखला का पता लगाएं।
- निर्धारित करें कि पूरी छवि का प्रतिशत किस छायांकित रंगों से बना है।
- एक थ्रेसहोल्ड खोजने का प्रयास करें जो प्रकार या लेखन या इमेजरी वाले पृष्ठों को पर्याप्त रूप से पहचानता है।
- शायद थ्रेसहोल्ड की सटीकता बढ़ाने के लिए छवि के टुकड़ों का परीक्षण करें।
मुझे पता है कि यह एक बढ़त मामला है, लेकिन क्या पीआईएल अनुभव वाले किसी भी व्यक्ति को कुछ पॉइंटर्स उधार दे सकते हैं?
+1 अच्छी सलाह। मुझे लगता है कि यहां तक कि एक साधारण छवि एन्ट्रॉपी गणना भी एक पृष्ठ के "खालीपन" का एक अच्छा पर्याप्त भेदभाव होगा। http://brainacle.com/calculating-image-entropy-with-python-how-and-why.html – Paul
ग्रेट प्वाइंट, पॉल। मैं हर दिन एक हिस्टोग्राम के साथ काम करता हूं फिर भी गणना एंट्रॉपी पर विचार नहीं करता। –