2010-12-05 12 views
7

मैं जानना चाहता हूं कि मोज़ाडा स्क्रीन स्क्रैपर कोड कैसे किया गया है?कैसे मोज़ेडा स्क्रीन स्क्रैप कोडित?

http://www.mozenda.com/screen-scraper

मैं एक ब्राउज़र जहां उपयोगकर्ता क्षेत्रों वह स्क्रैप करने के लिए चाहता है चुन सकते हैं पता चलता है और यह इसे से बाहर एक क्रॉल स्क्रिप्ट पैदा करता है।

क्रॉल स्क्रिप्ट जनरेशन भाग मुझे स्पष्ट है, मैं जानना चाहता हूं कि यह उपयोगकर्ता क्रियाओं को रिकॉर्ड करता है जो उपयोगकर्ता ब्राउज़र में कर रहा है।

मैं सी # का उपयोग कर कुछ ऐसा करना चाहता हूं।

+2

जब तक यह खुला स्रोत न हो, हम निश्चित रूप से नहीं बता सकते हैं कि निश्चित रूप से, उनका कोड कैसे काम करता है। मुझे ऐसा करने से नफरत है, लेकिन यह वास्तव में Google'ing "सी # वेब पेज स्क्रैपर" जितना सरल है और आपको जो भी खोज रहे हैं उसके कई उदाहरण मिलेंगे। –

+0

@ माइक, मुझे पता है कि सी # में एक स्क्रैपर कैसे बनाना है, मेरा सवाल यह था कि वे उपयोगकर्ता क्रियाओं को कैसे रिकॉर्ड कर रहे हैं। कृपया मेरे द्वारा साझा किए गए लिंक में वीडियो देखें और आप मेरे प्रश्न को समझेंगे। –

+0

आह, ठीक है फिर से हम संभवतः यह नहीं जानते कि वे इसे कैसे करते हैं क्योंकि यह कई तरीकों से किया जा सकता है लेकिन उनके वीडियो को देखकर मैं ब्राउज़र नियंत्रण का उपयोग करके, फॉर्म ऑब्जेक्ट और फ़ील्ड को कैप्चर करके, क्रियाओं को संग्रहीत करने के लिए एक मॉडल डिज़ाइन करूँगा , कार्यों को निर्दिष्ट करने के लिए एक इंटरफ़ेस बनाएं ... आदि। यह इतना सवाल है कि मुझे नहीं लगता कि आपको एक साधारण उत्तर मिल जाएगा क्योंकि यह एक साधारण सवाल नहीं है। –

उत्तर

2

मुझे लगता है कि वे बैकएंड पर iMacros की तरह कुछ चलाते हैं। मैं भी उनके स्क्रीनशॉट ;-)

आप सी # में यह अपने आप की तरह कुछ कोड करने के लिए चाहते हैं में से कुछ में iMacros ब्राउज़र आइकन देखा, IE WebBrowser नियंत्रण सबसे अच्छा प्रारंभिक बिंदु है!

2

@ yc08m, मैं आपको यह सुनिश्चित करने के लिए कह सकता हूं कि वे iMacros का उपयोग नहीं कर रहे हैं। यह सब अपने मालिकाना कोड के साथ कोडित है।

+0

क्या आप कुछ और प्रकाश डाल सकते हैं? –

2

मुझे एहसास है कि यह एक बेहद पुरानी पोस्ट है, लेकिन वे XPath पर भारी निर्भर हैं, इसलिए सबसे पहले चीजें आपको पृष्ठ को उस ऑब्जेक्ट में लोड करने की आवश्यकता होगी जिसे आप पूछ सकते हैं। मैं इसे पूरा करने के लिए एचटीएमएल एजिलिटी पैक जैसे कुछ का उपयोग करने की सलाह दूंगा।

संबंधित मुद्दे