जैसा कि प्रति कहा गया है कि पाठ फ़ाइल की सामग्री को बिना खोलने और बाइट्स के माध्यम से स्ट्रीमिंग के बिना वास्तव में कोई रास्ता नहीं है। यदि आप फ़ाइल डाउनलोड करने के लिए http का उपयोग करते हैं, तो आप लापरवाही कर सकते हैं, आप एक माइम प्रकार प्राप्त कर सकते हैं जो फ़ाइल के प्रकार को निष्क्रिय करता है, लेकिन अक्सर इसकी "ऑक्टेट-स्ट्रीम" होती है।
जबकि आप इसे मजबूर कर सकते हैं, और जब तक आप एक लाइन फीड ("\ n") नहीं पाते हैं तब तक पढ़ लें, फिर एक चरित्र का बैक अप लें और देखें कि कैरिज रिटर्न ("\ r") है, तो मैं एक और अधिक सांख्यिकीय दृष्टिकोण क्योंकि आपको डेटा को किसी भी तरह से पढ़ना है।
1) पढ़ने के लिए बाइट्स का एक नमूना आकार चुनें जिसमें आपको फ़ाइल से कम से कम 2 या 3 रिकॉर्ड्स प्राप्त करना चाहिए।
2) एक हिस्टोग्राम के रूप में प्रत्येक बाइट मुठभेड़ (i'assassign एकल बाइट चार सेट सेट) स्टोर करें। आप बाइट वैल्यू द्वारा अनुक्रमित एक आरी में अपनी गिनती संग्रह करके ऐसा कर सकते हैं या आप एक शब्दकोश का उपयोग कर सकते हैं।
3) कैरिज रिटर्न और लाइन फीड मानों की गणना करें। यदि आपके पास लाइन फीड गिनती है और कोई कैरिज रिटर्न नहीं है, तो यह एक यूनिक्स फ़ाइल है। यदि कैरिज रिटर्न और लाइन फीड गिना जाता है तो यह एक विंडोज फाइल है।
यह दृष्टिकोण आपको इनबाउंड फ़ाइल पर गुणवत्ता जांच के लिए करने की अनुमति देगा। क्या आपके पास हिस्टोग्राम में charcaters है जो अंपा संख्यात्मक नहीं हैं? फिर किसी ने आपको एक बाइनरी फाइल पास कर दी है। सभी ऊपरी मामले की उम्मीद है? फिर उपरोक्त वर्णों के बाहर की गणना कीजिए। एक गैर पाठ फ़ाइल को संसाधित करने के लिए आप कई चेक कर सकते हैं।
सुनिश्चित नहीं है, इसलिए टिप्पणी, लेकिन नियमित अभिव्यक्ति का उपयोग करना संभव होगा जैसे: \ r \ n $ '? यह जांच करेगा कि लाइन फीड '\ r \ n' के साथ समाप्त होती है। यदि ऐसा नहीं होता है, तो, यह एक यूनिक्स लाइन होना चाहिए। – npinti
नेट फ्रेमवर्क फ़ाइल एक्सेस ऑब्जेक्ट्स पर "रीडलाइन" विधियों में से किसी एक का उपयोग करने के रूप में, वास्तव में संभव नहीं है, न्यूलाइन अक्षरों को स्ट्रिप्स करता है। वे अच्छे हैं यदि आपको परवाह नहीं है कि फ़ाइल किस नई शैली की शैली का उपयोग कर रही है। अगर मैं एक स्ट्रीम के रूप में फ़ाइल को पढ़ता हूं, तो मैं कुछ ऐसा कर सकता हूं जैसा कि आप सुझाव देते हैं (जो मूल रूप से जिस विधि का मैं सहारा ले सकता हूं ..) – freshr
क्या आप गारंटी दे सकते हैं कि सभी लाइन समाप्ति फाइल के भीतर सुसंगत हैं? तकनीकी रूप से एक ही फ़ाइल में अलग-अलग मिश्रित रेखा समाप्ति होना संभव होगा। –