Wget

का उपयोग कर वेबपृष्ठ डाउनलोड करने के लिए उपयोगकर्ता-एजेंट के साथ कैसे काम करें I Wget का उपयोग करके इस पृष्ठ को डाउनलोड करने का प्रयास कर रहा हूं।Wget

http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&rt=nc&item=250972882769&si=a8iGAIchyvEbn7KveYFZ5QbEE7o%3D&print=all&category=31387

और यहाँ मेरी cmd है::

wget -O ebay.html --उपयोगकर्ता-एजेंट = "Mozilla/5.0 (Windows NT यहाँ पेज लिंक है 5.2; आर.वी.: 2.0.1) छिपकली/20,100,101 फ़ायरफ़ॉक्स/4.0.1 "" http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&rt=nc&item=250972882769&si=a8iGAIchyvEbn7KveYFZ5QbEE7o%3D&print=all&category=31387 "

जब मैं इसका इस्तेमाल एक ब्राउज़र यह ठीक काम करता है का उपयोग कर पृष्ठ तक पहुँचने के लिए। जब मैं Wget का उपयोग करता हूं, तो यह मूल पृष्ठ नहीं, एक और पृष्ठ डाउनलोड करता है। मुझे लगता है कि समस्या उपयोगकर्ता-एजेंट के लिए है। समाधान क्या है?

स्रोत

2012-01-15 qmaruf

फिडलर का उपयोग करने का प्रयास करें और जब आप अपने ब्राउज़र में यूआरएल खोलें तो http अनुरोध की संरचना देखें। बस अपनी wget कमांड में संरचना की नकल करें। –

क्या आप एक साधारण उदाहरण देंगे ?? – qmaruf

समस्या उपयोगकर्ता-एजेंट नहीं है, यह एक गायब कुकी या कुकीज़ है। समाधान

wget --save-कुकीज़ = ईबे-कुकीज़ के साथ सामान्य उत्पाद पृष्ठ,
मछली कि HTML फ़ाइल से बाहर "प्रिंट" लिंक यूआरएल को पुनः प्राप्त है। (मैं हाथ से ऐसा किया है, तो आप स्पष्ट रूप से यह करने के लिए एक स्क्रिप्ट लिखना चाहिए।)
wget के साथ "प्रिंट" यूआरएल पुनः प्राप्त --load-कुकीज़ = ईबे-कुकीज़

मैं एक यादृच्छिक साथ इसे करने की कोशिश उत्पाद पृष्ठ; इसने काम कर दिया।

स्रोत

2012-01-22 00:58:35

आपने यह कैसे पता लगाया कि ईबे-कुकीज यह है कि अगर मैं इसे किसी अन्य साइट के साथ करता हूं तो यह पता लगाने के लिए कि कौन सी कुकीज –

सक्षम करने के लिए कुकीज है, कुकीज सिर्फ कुकीज़ का संग्रह करने के लिए चुनी गई फाइल का नाम है आप जो भी नाम पसंद करते हैं उसका प्रयोग करें। महत्वपूर्ण हिस्सा साइट कुकीज़ और लोड-कुकीज़ को सहेजने और उन्हें वापस वेबसाइट पर भेजने के लिए - सेव-कुकीज़ का उपयोग है। –

उत्तर

संबंधित मुद्दे