2012-10-26 20 views
5

मैंने डेटाबेस में इस समस्या का शोध किया है, प्रश्नों को गुमराह किया है, और दो अलग-अलग त्रुटियां पाई हैं। मैंने यह निर्धारित किया है कि 503 त्रुटियां अमेज़ॅन को अवरुद्ध कर रही हैं लेकिन मुझे एक अलग त्रुटि मिलती है जो एक ही पंक्ति के साथ है लेकिन इसमें 503 रिटर्न नहीं है। मैं अंतर को समझने में सक्षम नहीं हूं। कोई भी मदद करने में सक्षम है? मुझे जो त्रुटियां मिल रही हैं वे नीचे सूचीबद्ध हैं। एचटीएमएल पार्सर मैं उपयोग कर रहा हूँ रहे हैं एचटीएमएल चपलता पैक और बस चंचलस्क्रैप ऑफ़र कोई परिणाम नहीं देता

http://www.amazon.com/gp/offer-listing/1902915208 error The remote server returned an error: (503) Server Unavailable.

और

Scrape Offers returned no results.

त्रुटि सुसंगत और इतने जाल करने के लिए आसान नहीं है। अगली स्क्रैप में त्रुटि आती है। यह बहुत यादृच्छिक है और लगातार उसी उत्पाद के साथ नहीं होता है। मुझे इन दिनों बहुत सारे मिल रहे हैं और यह मुझे कीमतों को अपडेट करने और ग्राहकों को सही जानकारी प्रदान करने से रोक रहा है।

+0

मुझे एक ही समस्या है। मैं जर्मनी में कर्ल और सर्वर का उपयोग कर रहा हूं। क्या आपको अभी तक कोई आत्मा मिली है? –

उत्तर

3

तो जैसा कि मैंने पाया, समस्या उपयोगकर्ता-एजेंट थी जो अमेज़ॅन को भेजी गई थी। मैंने अपने कर्ल-विकल्पों में निम्न आदेश जोड़ा और यह अब काम करता है - यहां तक ​​कि यूएस-प्रॉक्सी के बिना भी।

curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13) Gecko/20080311 Firefox/2.0.0.13'); 
0

मैंने प्रत्येक 20 वेबपृष्ठ अनुरोधों के बीच 1 सेकंड नींद डाली। और यह मेरी समस्या हल हो गई।

संबंधित मुद्दे