मैं एक ऐसे प्रोजेक्ट पर काम कर रहा हूं जो स्थानीय एचडी, से सभी फ़ाइलों को पढ़ता है, मैं उन एक्सटेंशन को निर्दिष्ट करता हूं जिन्हें मैं खोज में शामिल करना चाहता हूं।फ़ाइल पठनीय है (पाठ को इसके बजाय सुलभ है)
सभी चुनी गई फ़ाइल सीमाएं इस तथ्य पर आधारित हैं कि फ़ाइल टेक्स्ट सामग्री है।
तो मेरे उपयोग के लिए मैं कौन से विस्तार acount में रखना निर्दिष्ट कर सकते हैं, इस तरह के
रूप .cs .html .htm .css .js आदि ' क्या मैं एक विशेषता यह है कि सामान्य उपयोगकर्ता दिया जाएगा जोड़ना चाहते हैं एक्सटेंशन का चयन करने के लिए और उसे सभी उपलब्ध विंडोज़ फ़ाइल एक्सटेंशन से चुनने दें, लेकिन उस सूची में केवल उन फाइलों को शामिल करने के लिए जो उनके सिस्टम में टेक्स्ट हैं। उदाहरण के लिए हम जानते हैं कि exe, mp3। एमजीपी, एवी नहीं हैं लेकिन उनके पास कुछ अन्य प्रकार की फाइलें (.extensions) हो सकती हैं जिन्हें हमने ध्यान में नहीं रखा था।
सिस्टम फ़ाइल प्रॉपर्टी, पर आधारित यह तय करने का कोई तरीका है कि केवल टेक्स्ट सामग्री फ़ाइलों को फ़िल्टर करने का तरीका क्या होगा?
ऐसा करने का कोई अच्छा तरीका नहीं है ... तो हैकिश करें "पढ़ने की कोशिश करें और यदि आप सामग्री को समझ सकते हैं तो यह पाठ है" सर्वोत्तम "है। विषय पर पिछली चर्चाओं के लिए आप "एक्सटेंशन के बिना फ़ाइल प्रकार का पता लगाने" (या कुछ समान) खोजना चाहते हैं। –
एक्सटेंशन केवल फ़ाइल की सामग्री का एक कमजोर संकेत प्रदान करते हैं। मैं शर्त लगाता हूं कि वहाँ ऐसे अनुप्रयोग हैं जो पाठ वाले इन फ़ाइलों के बिना '.cs' एक्सटेंशन का भी उपयोग करते हैं। –
मुझे नहीं लगता कि एक है, कम से कम एक सामान्य नहीं है। उदाहरण के लिए: किसी शब्द फ़ाइल से एक्सटेंशन docx टेक्स्ट नहीं है, docx-files XML फ़ाइलों को ज़िपित कर रहे हैं। लेकिन एक उपयोगकर्ता के रूप में, आप शायद शब्द फ़ाइलों को पाठ माना जाएगा। –