मैं ग्रोवी में एक वेब पेज का विश्लेषण करना चाहता हूं और इसके साथ सभी href लिंक और संबंधित पाठ निकालना चाहता हूं।आप एक वेब पेज का विश्लेषण कैसे करते हैं और सभी href लिंक निकालें?
<a href="http://www.google.com">Google</a><br />
<a href="http://www.apple.com">Apple</a>
उत्पादन होगा::
Google, http://www.google.com<br />
Apple, http://www.apple.com
मैं एक ग्रूवी जवाब के लिए देख रहा हूँ
तो पेज इन कड़ियों निहित। उर्फ। आसान तरीका!
यह दृष्टिकोण एक साधारण लेकिन सही कारण के लिए बहुत अच्छा काम नहीं करेगा - आमतौर पर वेबसाइट में अच्छी तरह से बनाए गए एक्सएमएल नहीं होते हैं। यह कुछ मामलों में काम करेगा लेकिन सभी नहीं। – MeIr
यहां एक अच्छा लिंक है: http://blog.stannard.net.au/2010/05/12/parsing-html-with-groovy-and-htmlcleaner/ – MeIr