html-content-extraction

    12गर्मी

    3उत्तर

    में सलाह देते हैं मैं आदेश कुछ विशेषताओं/टैग आदि क्या एचटीएमएल पारसर्स आप की सिफारिश करते हैं के मूल्यों खोजने के लिए कुछ HTML पार्स करने के लिए करना चाहते हैं? कोई पेशेवर और विपक्ष?

    52गर्मी

    3उत्तर

    मैं एक HTML दस्तावेज़ जिसे टेक्स्ट की निम्न पैटर्न होते हैं में तत्वों पाने के लिए कोशिश कर रहा हूँ जिसमें एक एचटीएमएल टैग लगाने के लिए BeautifulSoup का उपयोग करना: # \ एस {11} <h2> this is cool #1234

    15गर्मी

    5उत्तर

    में किसी HTML को पार्स कैसे करते हैं, मैं जानना चाहता हूं कि vb.net में HTML को पार्स करने का कोई आसान तरीका है या नहीं। मुझे पता है कि एचटीएमएल एक्सएमएल का सिक्रेट सबसेट नहीं है, लेकिन अगर यह इस तरह

    45गर्मी

    9उत्तर

    का हिस्सा निकालें मैं एक HTML पृष्ठ से शीर्षक निकालने के लिए एक नियमित अभिव्यक्ति चाहता हूं। वर्तमान में मेरे पास यह है: title = re.search('<title>.*</title>', html, re.IGNORECASE).group() if title:

    5गर्मी

    6उत्तर

    मुझे किसी एप्लिकेशन में डेटा आयात करने के लिए वेब पृष्ठों की एक श्रृंखला का विश्लेषण करना होगा। प्रत्येक प्रकार का वेब पेज एक ही प्रकार का डेटा प्रदान करता है। समस्या यह है कि प्रत्येक पृष्ठ का HTML अ

    19गर्मी

    8उत्तर

    मैंने एक पूरे वेबपृष्ठ के एचटीएमएल को एक स्ट्रिंग में सहेजा है, और अब मैं लिंक से "href" मान को पकड़ना चाहता हूं, अधिमानतः बाद में उन्हें अलग-अलग तारों में सहेजने की क्षमता के साथ। ऐसा करने का सबसे अच