मेरे पास एक स्केपर CrawlSpider है जिसमें क्रॉल करने के लिए URL की एक बड़ी सूची है। मैं इसे रोकने में सक्षम होना चाहता हूं, वर्तमान स्थिति को सहेजना और इसे शुरू करने के बिना बाद में फिर से शुरू करना चाहता हूं। क्या यह स्केपर ढांचे के भीतर इसे पूरा करने का कोई तरीका है?मैं एक स्क्रैप क्रॉलस्पीडर को कैसे रोक सकता हूं और बाद में फिर से शुरू कर सकता हूं जहां यह बाएं बंद है?
उत्तर
सिर्फ कुछ महीने पहले माले पर एक प्रश्न हुई: http://groups.google.com/group/scrapy-users/browse_thread/thread/6a8df07daff723fc?pli=1
उद्धरण पाब्लो:
हम केवल इस पर विचार नहीं कर रहे हैं, लेकिन यह भी इस पर काम कर। पहले की तरह एक मकड़ी को चलाने के लिए http://hg.scrapy.org/users/pablo/mq/file/tip/scheduler_single_spider .... http://hg.scrapy.org/users/pablo/mq/file/tip/persistent_scheduler.patch : वहाँ वर्तमान में दो मेरी MQ में काम कर रहे पैच कि मामले में किसी को भी एक प्रारंभिक पूर्वावलोकन (वे क्रम में लागू किया जाना चाहिए) की कोशिश करना चाहता है इस कार्यक्षमता जोड़ने कर रहे हैं (कोई हठ):
scrapy crawl thespider
एक निर्देशिका में संग्रहीत अनुसूचक + dupefilter राज्य एक मकड़ी चलाने के लिए:
scrapy crawl thespider --set SCHEDULER_DIR=run1
क्रॉल के दौरान, आप^सी मारा रद्द करने के लिए कर सकते हैं क्रॉल और इसके साथ बाद में फिर से शुरू:
scrapy crawl thespider --set SCHEDULER_DIR=run1
SCHEDULER_DIR की स्थापना नाम अंतिम रिलीज होने से पहले बदलने के लिए बाध्य है, लेकिन यह विचार ही होगा - कि आप एक निर्देशिका जहां राज्य बने रहने गुजरती हैं।
आपको JOBDIR का उपयोग SCHEDULER_DIR नहीं करना चाहिए (नीचे niko_gramophon की पोस्ट देखें)। – Naijaba
बस यह साझा करना चाहता था कि यह सुविधा नवीनतम स्केपर संस्करण में शामिल है, लेकिन पैरामीटर नाम बदल दिया गया है। आप इसे इस तरह का उपयोग करना चाहिए:
scrapy क्रॉल thespider --set JOBDIR = run1
अधिक जानकारी यहां http://doc.scrapy.org/en/latest/topics/jobs.html#job-directory
@niko_gramphon, क्या आपको पता है कि यह डुप्लीटर राज्य को पुन: स्थापित करता है? और अगर हम एक सीएसवी फ़ाइल में लिख रहे हैं और वही फाइल का उपयोग कर फिर से शुरू करना चाहते हैं तो हमें पोशाक कोड जोड़ने की ज़रूरत है? धन्यवाद। – x89a10
Scrapy अब यहाँ प्रलेखित अपनी साइट पर इस बात के लिए काम कर रहे सुविधा है:
यहां वास्तविक आदेश दिया गया है:
scrapy crawl somespider -s JOBDIR=crawls/somespider-1
- 1. मैं फ्लोट बाएं कैसे रोक सकता हूं?
- 2. क्या मुझे टीटीएचड की ज़रूरत है? यदि ऐसा है तो मैं रोक सकता हूं, फिर से शुरू कर सकता हूं और उन्हें रोक सकता हूं?
- 3. स्क्रैप क्रॉलस्पीडर:
- 4. क्या मैं फ़्लैश स्क्रैप कर सकता हूं?
- 5. मैं डब्ल्यूपीएफ में लेआउट को कैसे निलंबित और फिर से शुरू कर सकता हूं?
- 6. पायथन में उपप्रोसेस मॉड्यूल का उपयोग करके मैं एक लिनक्स प्रोग्राम कैसे शुरू और बंद कर सकता हूं?
- 7. मैं वर्कर थ्रेड पर स्टैक ओवरफ़्लो से कैसे रोक सकता हूं या पुनर्प्राप्त कर सकता हूं?
- 8. मैं सभी jQuery एनिमेशन को कैसे रोक सकता हूं?
- 9. System.out बंद? क्या मैं इसे फिर से खोल सकता हूं?
- 10. वेब ऑडियो एपीआई: मैं एक ध्वनि के प्लेबैक को फिर से शुरू कैसे कर सकता हूं?
- 11. मैं कुकी कैसे सेट कर सकता हूं और फिर PHP में रीडायरेक्ट कर सकता हूं?
- 12. मैं zsh में कैसे रोक सकता हूं?
- 13. मैं कैसे अक्षम कर सकता हूं और फिर चेतावनी को पुनः सक्षम कर सकता हूं?
- 14. मैं Java3D को तेज़ी से कैसे शुरू कर सकता हूं?
- 15. मैं अपनी एएसपीनेट साइट को स्क्रीन स्क्रैप होने से कैसे रोक सकता हूं?
- 16. मैं जूमला में कोड कैसे शुरू कर सकता हूं और लिख सकता हूं?
- 17. मैं पर्सफोर्स में एकीकरण को पूर्ववत कैसे कर सकता हूं, और फिर भी इसे फिर से करने में सक्षम हूं?
- 18. मैं पर्ल के साथ स्क्रैप कैसे स्क्रीन कर सकता हूं?
- 19. मैं अनिश्चित काल तक लूप कैसे कर सकता हूं, लेकिन कुछ स्थितियों पर रोक सकता हूं?
- 20. मैं आईओएस डिवाइस पर डिमिंग और बंद करने से डिस्प्ले को कैसे रोक सकता हूं?
- 21. क्या मैं एक सी ++ मैक्रो को फिर से परिभाषित कर सकता हूं, फिर इसे वापस परिभाषित कर सकता हूं?
- 22. मैं एक सबराउटिन को फिर से परिभाषित कैसे कर सकता हूं और बूढ़ा भी रख सकता हूं?
- 23. जब मैं Emacs में कोष्ठक बंद करता हूं तो कर्सर को कूदने से कैसे रोक सकता हूं?
- 24. मैं निर्भरताओं को अद्यतन करने से कैसे रोक सकता हूं?
- 25. जब मैं डीबगिंग शुरू करता हूं तो मैं डब्लूसीएफ परीक्षण क्लाइंट को खोलने से कैसे रोक सकता हूं?
- 26. मैं एचटीएमएल में पाठ से एचटीएमएल कैसे रोक सकता हूं?
- 27. मैं कैसे फीका कर सकता हूं, परीक्षण बदल सकता हूं और फिर jQuery के साथ साफ-सफाई कर सकता हूं?
- 28. मैं सी ++ में एएसएसईआरटी (एक्स) कैसे बंद कर सकता हूं?
- 29. मैं CruiseControl.NET में समवर्ती बिल्ड को कैसे रोक सकता हूं?
- 30. मैं NSOperationQueue में NSOperation को कैसे रोक सकता हूं?
स्कैरपी v। 0.16 के रूप में अब इसे यहां समर्थन करता है: http://doc.scrapy.org/en/0.16/topics/jobs.html –