Wget

2012-01-15 14 views
17

का उपयोग कर वेबपृष्ठ डाउनलोड करने के लिए उपयोगकर्ता-एजेंट के साथ कैसे काम करें I Wget का उपयोग करके इस पृष्ठ को डाउनलोड करने का प्रयास कर रहा हूं।Wget

http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&rt=nc&item=250972882769&si=a8iGAIchyvEbn7KveYFZ5QbEE7o%3D&print=all&category=31387

और यहाँ मेरी cmd है::

wget -O ebay.html --उपयोगकर्ता-एजेंट = "Mozilla/5.0 (Windows NT यहाँ पेज लिंक है 5.2; आर.वी.: 2.0.1) छिपकली/20,100,101 फ़ायरफ़ॉक्स/4.0.1 "" http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&rt=nc&item=250972882769&si=a8iGAIchyvEbn7KveYFZ5QbEE7o%3D&print=all&category=31387 "

जब मैं इसका इस्तेमाल एक ब्राउज़र यह ठीक काम करता है का उपयोग कर पृष्ठ तक पहुँचने के लिए। जब मैं Wget का उपयोग करता हूं, तो यह मूल पृष्ठ नहीं, एक और पृष्ठ डाउनलोड करता है। मुझे लगता है कि समस्या उपयोगकर्ता-एजेंट के लिए है। समाधान क्या है?

+0

फिडलर का उपयोग करने का प्रयास करें और जब आप अपने ब्राउज़र में यूआरएल खोलें तो http अनुरोध की संरचना देखें। बस अपनी wget कमांड में संरचना की नकल करें। –

+0

क्या आप एक साधारण उदाहरण देंगे ?? – qmaruf

उत्तर

13

समस्या उपयोगकर्ता-एजेंट नहीं है, यह एक गायब कुकी या कुकीज़ है। समाधान

  1. wget --save-कुकीज़ = ईबे-कुकीज़ के साथ सामान्य उत्पाद पृष्ठ,
  2. मछली कि HTML फ़ाइल से बाहर "प्रिंट" लिंक यूआरएल को पुनः प्राप्त है। (मैं हाथ से ऐसा किया है, तो आप स्पष्ट रूप से यह करने के लिए एक स्क्रिप्ट लिखना चाहिए।)
  3. wget के साथ "प्रिंट" यूआरएल पुनः प्राप्त --load-कुकीज़ = ईबे-कुकीज़

मैं एक यादृच्छिक साथ इसे करने की कोशिश उत्पाद पृष्ठ; इसने काम कर दिया।

+0

आपने यह कैसे पता लगाया कि ईबे-कुकीज यह है कि अगर मैं इसे किसी अन्य साइट के साथ करता हूं तो यह पता लगाने के लिए कि कौन सी कुकीज –

+2

सक्षम करने के लिए कुकीज है, कुकीज सिर्फ कुकीज़ का संग्रह करने के लिए चुनी गई फाइल का नाम है आप जो भी नाम पसंद करते हैं उसका प्रयोग करें। महत्वपूर्ण हिस्सा साइट कुकीज़ और लोड-कुकीज़ को सहेजने और उन्हें वापस वेबसाइट पर भेजने के लिए - सेव-कुकीज़ का उपयोग है। –

संबंधित मुद्दे