मैं जानना चाहता हूं कि नोडजेस के लिए स्केपर की तरह कुछ है या नहीं? यदि नहीं, तो आप सरल पेज डाउनलोड का उपयोग करने और चीरियो का उपयोग करके इसे पार्स करने के बारे में क्या सोचते हैं? क्या कोई बेहतर तरीका है।नोडज के लिए उपकरण की तरह स्केपर?
उत्तर
मैंने पाइथन में स्केपर जैसी संपूर्ण वेबसाइटों को क्रॉल/अनुक्रमणित करने के लिए इतना मजबूत समाधान नहीं देखा है, इसलिए व्यक्तिगत रूप से मैं वेबसाइटों को क्रॉल करने के लिए पायथन स्कैरपी का उपयोग करता हूं।
लेकिन पृष्ठों से डेटा स्क्रैप करने के लिए कैस्परजे नोडजेज़ में है। यह एक बहुत अच्छा समाधान है। यह AJAX वेबसाइटों के लिए भी काम करता है, उदा। कोणीय-जेएस पेज। पायथन स्कैंच AJAX पृष्ठों को पार्स नहीं कर सकता है। तो एक या कुछ पृष्ठों के लिए डेटा स्क्रैप करने के लिए मैं CasperJs का उपयोग करना पसंद करता हूं।
चीरियो कैस्पर्ज से वास्तव में तेज़ है, लेकिन यह AJAX पृष्ठों के साथ काम नहीं करता है और इसमें कैस्पर जैसे कोड की ऐसी अच्छी संरचना नहीं है। तो जब आप चीरियो पैकेज का उपयोग कर सकते हैं तब भी मैं कैस्परज पसंद करता हूं।
कॉफी स्क्रिप्ट उदाहरण:
casper.start 'https://reports.something.com/login', ->
this.fill 'form',
username: params.username
password: params.password
, true
casper.thenOpen queryUrl, {method:'POST', data:queryData}, ->
this.click 'input'
casper.then ->
get = (number) =>
value = this.fetchText("tr[bgcolor= '#AFC5E4'] > td:nth-of-type(#{number})").trim()
बस आपको अभी भी एक उत्तर की आवश्यकता है, https://www.npmjs.org/package/scrapy मैंने कभी इसका परीक्षण नहीं किया, लेकिन लगता है कि इससे मदद मिल सकती है। खुश स्क्रैपिंग।
- 1. WPF के लिए उपकरण की तरह फायरबग?
- 2. Erlang के लिए उपकरण की तरह कोई आरएसपीसी?
- 3. वहाँ एक उपकरण एंड्रॉयड के लिए मशीनीकरण की तरह है?
- 4. नोडज
- 5. स्केपर
- 6. स्केपर
- 7. नोडज
- 8. स्केपर
- 9. नोडज
- 10. वीबीस्क्रिप्ट के लिए जेएसएफडल की तरह कुछ?
- 11. नोडज
- 12. स्केपर
- 13. स्केपर
- 14. स्केपर
- 15. स्केपर
- 16. स्केपर
- 17. स्केपर
- 18. नोडज मॉड्यूल?
- 19. स्केपर: एकाधिक रिटर्न/डेटाबेस के लिए सुझाव
- 20. सीएसएस रंगों की सफाई के लिए उपकरण
- 21. Emacs के लिए Vim के Vtrp की तरह कुछ?
- 22. क्या gccxml की तरह रैपर पीढ़ी के लिए कोई सी हेडर पार्सर उपकरण है?
- 23. क्या जावा के लिए सेमेक की तरह एक उपकरण बहुत अधिक है?
- 24. स्केपर: cmdline.execute()
- 25. नोडज एचटीटीपीएस
- 26. नोडज स्ट्रीमिंग
- 27. स्केपर स्पाइडर:
- 28. क्या जावा के लिए CHESS की तरह कुछ मौजूद है?
- 29. स्केपर HtmlXPathSelector
- 30. सफारी ब्राउज़र के लिए प्लगइन की तरह फायरबग
इस मॉड्यूल कॉन्फ़िगर नहीं किया जा सकता है। यह केवल व्यवसाय का नाम और फोन देता है। मुझे स्क्रैपी के रूप में कलाकार के रूप में एक संभावित समाधान नहीं मिला। लेकिन चेरीओ का उपयोग करके पेज को हेरफेर करना संभव होगा। Jquery का उपयोग करने की तरह। – user2422940