2010-09-22 8 views
18

मैं एक वेबसाइट को क्रॉल करना चाहता हूं, समस्या यह है कि यह जावास्क्रिप्ट की चीजों से भरा है, जैसे कि बटन और जैसे कि जब उन्हें दबाया जाता है, वे यूआरएल नहीं बदलते हैं, लेकिन पेज पर डेटा बदल दिया जाता है।मैं एक पर्ल वेब क्रॉलर में जावास्क्रिप्ट को कैसे संभाल सकता हूं?

आमतौर पर मैं साइटों को क्रॉल करने के लिए एलडब्लूपी/मैकेनाइज इत्यादि का उपयोग करता हूं, लेकिन न ही जावास्क्रिप्ट का समर्थन करता हूं। कोई विचार?

उत्तर

7

WWW::Scripter मॉड्यूल में JavaScript plugin है जो उपयोगी हो सकता है। यह नहीं कह सकता कि मैंने इसे स्वयं इस्तेमाल किया है, हालांकि।

5

WWW::Mechanize::Firefox साथ Selenium हो काम का हो सकता हो सकता है। इस तरह आप फ़ायरफ़ॉक्स को जटिल जावास्क्रिप्ट समस्याओं को संभाल सकते हैं और फिर परिणामस्वरूप एचटीएमएल निकाल सकते हैं। आईई/फ़ायरफ़ॉक्स/क्रोम के लिए

0

मैं HtmlUnit और पर्ल आवरण सुझाव है।

संबंधित मुद्दे