PhantomJSBeautifulSoup के विकल्प का उपयोग किया जा सकता है?phantomjs के साथ लिंक कैसे स्क्रैप करें
मैं एटीसी पर खोजने और टर्म में सभी लिंक पर जाने की कोशिश कर रहा हूं। पायथन में, मुझे पता है कि यह कैसे करें (सुंदर सूप के साथ) लेकिन आज मैं देखना चाहता हूं कि मैं फैंटॉमजेएस के साथ ऐसा कर सकता हूं या नहीं। मैं बहुत दूर नहीं जा रहा हूँ।
इस स्क्रिप्ट को एटीसी पर "हैलो किट्टी" खोजना चाहिए और सभी उत्पादों को <a class="listing-thumb" href=...></a>
वापस करना चाहिए और उन्हें कंसोल में प्रिंट करना चाहिए। आदर्श रूप में मैं उन्हें बाद में देखूंगा और मुझे जो जानकारी चाहिए उसे प्राप्त करें। अभी यह सिर्फ जम जाता है। कोई विचार?
var page = require('webpage').create();
var url = 'http://www.etsy.com/search?q=hello%20kitty';
page.open(url, function(status){
// list all the a.href links in the hello kitty etsy page
var link = page.evaluate(function() {
return document.querySelectorAll('a.listing-thumb');
});
for(var i = 0; i < link.length; i++){ console.log(link[i].href); }
phantom.exit();
});
मैं CasperJS है, जो बेहतर इस बात के लिए तैयार किया जा सकता है का उपयोग कर के साथ toyed है।
मैं [cheerio] (https://github.com/MatthewMueller/cheerio) की जांच करने की सलाह देता हूं। यह वेब पेजों को स्क्रैप करने के कार्य के लिए बिल्कुल उपयुक्त है, और इसके ट्रैवर्सल/मैनिपुलेशन एपीआई jQuery के समान ही हैं। – davidchambers