हां, वे अलग हैं। अभ्यास में, आपको दोनों का उपयोग करने की आवश्यकता हो सकती है।
(मैं क्योंकि, अब तक, अन्य उत्तर यह का सार करने के लिए नहीं मिलता है में कूद करने के लिए है। वे उदाहरण का उपयोग लेकिन भेद स्पष्ट नहीं बनाते हैं। दी, वे 2010 से कर रहे हैं!)
वेब स्क्रैपिंग, न्यूनतम परिभाषा का उपयोग करने के लिए, वेब दस्तावेज़ को संसाधित करने और इसकी जानकारी निकालने की प्रक्रिया है। आप वेब क्रॉलिंग किए बिना वेब स्क्रैपिंग कर सकते हैं।
वेब क्रॉलिंग, न्यूनतम परिभाषा का उपयोग करने के लिए, बीज यूआरएल की सूची से शुरू होने वाले वेब लिंक को खोजने और लाने की प्रक्रिया है। सच पूछिये तो, वेब क्रॉलिंग ऐसा करने के लिए, आप scraping वेब के कुछ डिग्री करने के लिए (। यूआरएल को निकालने के लिए)
कुछ अवधारणाओं अन्य उत्तर में उल्लेख स्पष्ट करने के लिए है:
robots.txt
करने का इरादा है किसी भी स्वचालित प्रक्रिया पर लागू होता है जो किसी वेब पेज तक पहुंचता है। तो यह क्रॉलर और स्क्रैपर्स दोनों पर लागू होता है।
'उचित' क्रॉलर और स्क्रैपर्स, दोनों को स्वयं को सटीक रूप से पहचानना चाहिए।
कुछ संदर्भों:
स्रोत
2012-06-21 17:08:37
स्क्रैपिंग का अर्थ किसी पृष्ठ से सामग्री खींचना है। क्रॉलिंग का अर्थ है कई पृष्ठों तक पहुंचने के लिए लिंक का पालन करना। क्रॉलर्स को खरोंच करना पड़ता है, और यह दो कारणों से होता है: एक वह उपयोगी क्रॉलर न केवल कुछ भी पृष्ठों के लिए ट्रैवर्स करता है; वे जानकारी एकत्र करते हैं (उदाहरण के लिए एक खोज इंजन के लिए एक खोज सूचकांक बनाने के लिए अनुक्रमण शब्द)। दूसरा, उन्हें अन्य पृष्ठों के लिंक खोजना होगा। – Kaz