मैं जटिल वेब पेजों से तालिकाओं को पार्स करने के लिए एचटीएमएल चपलता पैक का उपयोग करना चाहता हूं, लेकिन मैं ऑब्जेक्ट मॉडल में किसी तरह खो गया हूं।एचटीएमएल एजिलिटी पैक - पार्सिंग टेबल
मैंने लिंक उदाहरण देखा, लेकिन इस तरह कोई टेबल डेटा नहीं मिला। क्या मैं टेबल प्राप्त करने के लिए XPath का उपयोग कर सकता हूं? टेबल को कैसे प्राप्त किया जाए, इस बारे में डेटा लोड करने के बाद मैं मूल रूप से खो गया हूं। मैंने इसे पर्ल में पहले किया है और यह थोड़ा बेकार था, लेकिन काम किया। (HTML::TableParser
)।
मैं भी खुश हूं अगर कोई पार्सिंग के लिए सही ऑब्जेक्ट ऑर्डर पर प्रकाश डाल सकता है।
हाय मार्क, क्या आप बड़ी फाइलों को पार्स करने पर सलाह दे सकते हैं? 50 एमबी फाइलों से अधिक, मैं बाल टी नोड्स नहीं ला सकता बड़ी फाइलों पर। –
@Marc - यदि तालिका पेजिंग है, तो स्क्रैप करके अगले पृष्ठ पर कैसे जाएं? –
@Dark_Knight आपको जो भी AJAX मार्ग मूल पृष्ठ –