2013-04-02 6 views
9

मैं dblp XML फ़ाइलों के साथ काम कर रहा हूं। मैं वास्तव में dblp.xml फ़ाइल को पार्स करना चाहता हूं और कुछ प्रोजेक्ट में आगे की प्रसंस्करण के लिए उपयोगी जानकारी निकालना चाहता हूं। और वह एक्सएमएल फ़ाइल बहुत बड़ी है (1.1 जीबी) और मैं इस फाइल को भी खोलने में असमर्थ हूं।सी # में बहुत बड़ी एक्सएमएल फाइलों का विश्लेषण कैसे करें?

कृपया मुझे मार्गदर्शन करें यदि आपके पास dblp.xml के लिए सी # पार्सर है या आप इसके बारे में मुझे मार्गदर्शन कर सकते हैं, या हम विशाल xml फ़ाइलों को कैसे पार्स कर सकते हैं।

+3

XML पार्सिंग इतने पर nauseam_ _as चर्चा की गई। यहां एक ऐसी चर्चा है जो आपको प्रबुद्ध कर सकती है: http://stackoverflow.com/questions/55828/how-does-one-parse-xml-files – joce

+1

http://msdn.microsoft.com/en-us/ पर XStreamingElement देखें लाइब्रेरी/system.xml.linq.xstreamingelement.aspx भी साथ ही। –

+0

रयान गेट्स -> एक्सएमएल प्रारूप में ओएसएम फाइलें। यह कारण हो सकता है। – Kostadin

उत्तर

6

आप का उपयोग करने के XmlReader

यह एक पाठक है कि तेजी से, noncached, XML आंकड़ों के आगे केवल पहुँच प्रदान करता है का प्रतिनिधित्व करता है की जरूरत है: एक्सएमएल डोम स्मृति में पूरी फ़ाइल जो पूरी तरह बेकार है संग्रहीत करता है। सभी डेटा को स्मृति के में लोड नहीं करेगा, जिसका उपयोग डेटा के बड़े सेट के साथ किया जाना चाहिए। अन्य .NET समाधान में निर्मित पूर्ण जेनरेट ऑब्जेक्ट ग्राफ़ रखें।

XmlReader in action (by Jon Skeet)

संबंधित मुद्दे

 संबंधित मुद्दे