2008-08-05 8 views
16

मैं एक रात क्रॉन जॉब है कि मेरे stackoverflow पेज को हासिल करेगा और पिछले दिन के पृष्ठ से diffs करना चाहते हैं, इसलिए मैं अपने प्रश्न, उत्तर का एक परिवर्तन सारांश देख सकते हैं, रैंकिंग, आदिवेब पेज को कर्ल या wget कैसे करें?

दुर्भाग्य से, मैं नहीं कर सके इस काम को करने के लिए कुकीज़ का सही सेट नहीं मिलता है। कोई विचार?

साथ ही, जब बीटा समाप्त हो जाए, तो क्या मेरा स्टेटस पेज लॉग इन किए बिना पहुंच योग्य होगा?

उत्तर

9

आपका स्टेटस पेज लॉग इन किए बिना अब उपलब्ध है (logout पर क्लिक करें और इसे आजमाएं)। जब बीटा-कुकी अक्षम होती है, तो आपके और आपके स्टेटस पेज के बीच कुछ भी नहीं होगा।

wget के लिए:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html 
3

अच्छा विचार :)

मैं तुम्हें का उपयोग किया है अनुमान wget के

--load-cookies (filename) 

एक छोटे से मदद कर सकता है, लेकिन यह एक ब्राउज़र की नकल करने के मशीनीकरण की तरह कुछ (पर्ल या अजगर में) का उपयोग करने के लिए आसान हो सकता है एक अच्छा मकड़ी पाने के लिए और अधिक पूरी तरह से।

2

मैं यह पता लगाने सकता है नहीं कैसे कुकीज़ या तो काम करने के लिए प्राप्त करने के लिए, लेकिन मैं अपने ब्राउज़र में मेरी स्थिति पेज को पाने के लिए जब मैं लॉग आउट किया गया था कर रहा था, तो मैं मान लें कि स्टैक ओवरफ्लो सार्वजनिक हो जाने पर यह काम करेगा।

यह एक दिलचस्प विचार है, लेकिन क्या आप अंतर्निहित HTML कोड के अंतर भी नहीं उठाएंगे? क्या आपके पास एचटीएमएल के एक अंतर के साथ खत्म होने से बचने की रणनीति है, न कि वास्तविक सामग्री?

+0

अगर मैं समय था, मैं एक [ब्यूटीफुल सूप] बनाना होगा (http://www.crummy.com/software/BeautifulSoup/) (या कुछ और बेहतर?) स्क्रिप्ट अच्छी तरह से डेटा को स्क्रैप करने के लिए, लेकिन अभी के लिए मैं बस मुझे आवश्यक पाठ की लाइनों को बाहर निकाल रहा हूँ। –

2

और यहाँ क्या काम करता है ...

curl -s --cookie soba=. http://stackoverflow.com/users 
6

से Mark Harrison

और यहाँ क्या काम करता है ...

कर्ल -s --cookie सोबा =। https://stackoverflow.com/users

और wget के लिए:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html 
संबंधित मुद्दे