2010-10-22 12 views
5

मैं एक साधारण हल्के जावा पुस्तकालय की तलाश में हूं जो HTML को पार करता है। मैंने बहुत कुछ देखा है और वहां कई विकल्प हैं। लेकिन मुझे कुछ आसान नहीं मिल रहा है। मैं वास्तव में जावा में छोड़कर अजगर में पाईकरी की तरह कुछ करना चाहता हूं। मेरी आवश्यकताएं हैं: तेज़, उपयोग करने में आसान और हल्के वजन।jquery जैसे java

मुझे इसके लिए क्या चाहिए? यह सुनिश्चित नहीं है कि यह मायने रखता है, लेकिन मुझे एक HTML दस्तावेज़ों के हिस्सों को अनुक्रमणित करने की आवश्यकता है। इसलिए मैं उम्मीद कर रहा हूं कि उस दस्तावेज़ का हिस्सा जल्दी से चुनने में सक्षम हो और फिर इसे पार्स करें।

उत्तर

6

मैंने अतीत में HTMLParser का उपयोग किया है। मैं इसके साथ बहुत खुश नहीं था। मुझे टैग्सप और जेएसओप मिला। मुझे वास्तव में jsoup पसंद है। बड़े पैमाने पर अभी तक उपयोग नहीं किया है, लेकिन आप की तरह कुछ कर सकते हैं: जैरी पर

Elements resultLinks = doc.select("h3 > a"); // direct a after h3 
+0

jsoup का उपयोग करने के बाद मुझे लगता है कि यह वही है जो मैं ढूंढ रहा था। मुझे समझ में नहीं आता कि इतने सारे गुगलिंग के बाद क्यों, यह नहीं मिला। लेकिन इसमें लगभग हर सुविधा है जो मुझे चाहिए। –

2

ग्रोवी का प्रयास करें। इसमें कई "स्लर्स" हैं, जो एक्सएमएल और एचटीएमएल, साथ ही जेएसओएन जैसे मार्कअप में पढ़ने के लिए डीएसएल हैं। उदाहरण के लिए here

+0

क्यों इस के ख़िलाफ़ मतदान हो जाता है लग रहा है? – Ben

+3

और – Ben

+0

ग्रोवी एक ऐसी भाषा है जो JVM पर चलती है और अनिवार्य रूप से आपके प्रोजेक्ट में शामिल करना बहुत आसान है, यह टिप्पणी किए बिना वोट देने के लिए यह बहुत लंगड़ा है। मुझे कोई कारण नहीं दिख रहा है कि इसे क्यों वोट दिया गया था। –

0

यदि आप लाइब्रेरी की तरह एक jQuery चाहते हैं, क्योंकि आपके प्रश्न का शीर्षक बताता है, तो आपको GWT पर एक नज़र रखना चाहिए।

जीडब्ल्यूटी आपको अपने पृष्ठ के डीओएम का पता लगाने देगा। ट्यूटोरियल की कोशिश करो और 30 मिनट में आप अगर आप अधिक या नहीं जानना चाहता हूँ यकीन है कि हो जाएगा ...

+0

यह पाठ को पार्स करने के लिए वास्तव में भारी लगता है :( –

1

उपयोग tagsoup एक्सएचटीएमएल में HTML को सामान्य बनाने, और XOM जिसके परिणामस्वरूप दस्तावेज़ को पार्स करने। यह इतना मुश्किल नही है।

XPath आपको सीएसएस चयनकर्ताओं के समान आसान चयन देगा।

+1

मुझे http://ssoup.org/ पर jsoup मिला है, यह टैगपॉप के समान है? –

+0

इसी तरह दिखता है। टैग्सप में एक जावा लाइब्रेरी है जिसे आप डाउनलोड कर सकते हैं , भी, लेकिन यह कोई पार्सिंग या क्षमता नहीं ढूंढता है; यह सिर्फ अच्छा एक्सएमएल उत्पन्न करता है जिसे आप पार्स कर सकते हैं। –