Jsoup

2012-09-26 27 views
5

के साथ एक विशाल HTML स्ट्रीम को पार्स करना कोई भी पॉइंटर या सलाह दे सकता है कि मैं एक बेहद बड़ी HTML स्ट्रीम/फ़ाइल को पार्स करने से कैसे निपटूंगा। उदाहरण के लिए मेरे पास लगभग 270,000 पंक्तियों वाली एक टेबल है, मैं इसे एक समय में अपने ऐप में लगभग 20k में लाना चाहता हूं। Jsoup parse विधि HTML के टुकड़ों के लिए अनुमति देता है, लेकिन यह मेरे लिए अस्पष्ट है कि इस खंड का प्रतिनिधित्व करने वाले XXX बाइट्स को पढ़ने का सबसे कुशल और साफ तरीका क्या हो सकता है।Jsoup

किसी भी मदद की सबसे सराहना की।

उत्तर

0

यदि यह एक्सएचटीएमएल है, और आपको पूरी चीज को एक साथ स्मृति में रखने की आवश्यकता नहीं है, तो एक बेहतर शर्त एक एसएक्स पार्सर का उपयोग करना और प्रारंभ और अंत टैग घटनाओं का उपयोग करके आवश्यक डेटा को चुनना है।

एक और विचार एक स्थिर पार्सर हो सकता है।

+0

बस नियमित एचटीएमएल। – rkd80

संबंधित मुद्दे