2010-12-15 10 views
5

मैं प्रलेखन के लिए देख रहा हूँ (आधिकारिक तौर पर प्रलेखन करता है, तो यह संभव है)।jTidy और TagSoup और jTidy पुस्तकालयों के लिए TagSoup प्रलेखन

मैं html "tagsoup" फ़ाइलों को (एचटीएमएल, एक्सएचटीएमएल या एचटीएमएल 5) टैग एचटीएमएल के बीच मिश्रित अलग नामस्थान साथ एक्सएमएल टैग शामिल हेरफेर करने के लिए इस पुस्तकालयों का उपयोग करना चाहते हैं।

मैंने HTMLCleaner, NekoHTML और Jericho का परीक्षण किया है, लेकिन मुझे फ़ाइल को साफ़ करने के लिए सरल उदाहरणों के अलावा, jTidy और TagSoup के लिए दस्तावेज़ नहीं मिला है।

मैं, प्रलेखन की आवश्यकता के बारे में सामग्री में हेरफेर, टैग की जगह, जानकारी निकालने आदि ...

धन्यवाद

नोट: परीक्षण के बाद सभी विकल्प, मैं StAX/इस्तेमाल किया Woodstox:

+2

डी आईडी आप [Jsoup] (http://jsoup.org) पर विचार करते हैं? यह नहीं किया जा सकता [बेहतर/आसान] (http://stackoverflow.com/questions/3152138/what-are-the-pros-and-cons-of-the-leading-java-html-parsers)। इसमें एक अच्छी [कुकबुक] (http://jsoup.org/cookbook/) भी है। – BalusC

+0

मैं जेएसओपी का परीक्षण कर रहा हूं। वह आसान लगती है लेकिन उदाहरण कोड देखें, ऐसा कोई थ्रेड-सुरक्षित नहीं लगता है। क्या मैं सही हू? – angelcervera

+0

क्या यह मुझे है या Jsoup आउटपुट स्ट्रीम का समर्थन नहीं करता है? – slott

उत्तर

2

tagsoup-मित्र गूगल समूह पर एक समान सवाल का जवाब में मदद कर सकते हैं:

Documentation for TagSoup

आप शायद पहले से ही, उन्हें देखा है लेकिन JTidy के लिए जावाडोक यहाँ उपलब्ध है: http://jtidy.sourceforge.net/apidocs/index.html

+0

तो टैग सूप SAX एपीआई का उपयोग करें, लेकिन ¿JTidy? :(धन्यवाद – angelcervera

+0

JTidy नहीं है, यह मूल रूप से कुछ की तरह आप इसे एक इनपुट स्ट्रीम देते हैं, यह पार्स और फिर उत्पादन धारा से आउटपुट प्राप्त है। – Gilbeg

संबंधित मुद्दे