मुझे स्केपर (लगभग 1 पृष्ठ/सेकंड) के साथ धीमी क्रॉल गति का सामना करना पड़ रहा है। मैं aws सर्वर से एक प्रमुख वेबसाइट क्रॉल कर रहा हूं इसलिए मुझे यह नेटवर्क समस्या नहीं है। सीपीयू उपयोग 100 के करीब कहीं नहीं है और यदि मैं एकाधिक स्क्रैप प्रक्रियाओं को शुरू करता हूं तो क्रॉल गति बहुत तेज होती है।स्केपर क्रॉलिंग स्पीड धीमा है (60 पेज/मिनट)
स्क्रैप पृष्ठों का एक गुच्छा क्रॉल करने लगता है, फिर कई सेकंड के लिए लटकता है, और फिर दोहराता है।
मैं के साथ खेल की कोशिश की है: CONCURRENT_REQUESTS = CONCURRENT_REQUESTS_PER_DOMAIN = 500
लेकिन यह वास्तव में अतीत सुई स्थानांतरित करने के लिए नहीं लगता है के बारे में 20.
कौन सा स्केपर संस्करण? कोई गैर-डिफ़ॉल्ट सीमा/मिडलवेयर? विराम कुछ ब्लॉकिंग कोड हो सकता है, क्या आप कुछ कर रहे हैं (उदाहरण के लिए डीबी को डेटा लिखना, एस 3 पर अपलोड करना आदि) रिएक्टर को अवरुद्ध करने वाले रिएक्टर थ्रेड में? –
@ सोमैयर चेक सीपीयू | एचडीडी | एलसीएमएलएल के साथ पेज को पार्स किए बिना नेटवर्क स्क्रैपिंग के साथ नेटवर्क उपयोग। 'LOG_LEVEL =' DEBUG'' – nk9