2010-06-25 32 views
8

के साथ लॉगिन की आवश्यकता है, मैं अपनी साइटों के लिए कई विज्ञापन नेटवर्क का उपयोग करता हूं, और यह देखने के लिए कि मैंने कितना पैसा बनाया है, मुझे मूल्य जोड़ने के लिए प्रत्येक दैनिक में लॉग इन करने की आवश्यकता है। मैं एक पाइथन लिपि बनाने की सोच रहा था जो मेरे लिए त्वरित कुल प्राप्त करने के लिए ऐसा करेगा। मुझे पता है कि मुझे लॉग इन करने के लिए एक POST अनुरोध करने की आवश्यकता है, फिर कुकीज़ को संग्रहीत करें जो मुझे वापस मिलें और फिर उन कुकीज में गुजरते समय रिपोर्ट पेज का अनुरोध करें।स्क्रैपिंग साइट्स जिन्हें पाइथन

पाइथन में दोहराने का सबसे सुविधाजनक तरीका क्या है जब मैं साइट्स मैन्युअल रूप से ब्राउज़ करता हूं?

http://stockrt.github.com/p/emulating-a-browser-in-python-with-mechanize/

उत्तर

6

देखें एक इंटरनेट एक्सप्लोरर कैश (इसलिए, यदि आप विंडोज पर प्रत्येक साइट पर मैन्युअल रूप से लॉग इन कर सकते हैं, तो आप निश्चित रूप से उसी कुकीज के आधार पर भविष्य में लॉग इन के लिए cookielib या मशीनीकरण का उपयोग कर सकते हैं - जब तक कि वे निश्चित रूप से समाप्त नहीं हो जाते)।

+0

लेकिन यह जावास्क्रिप्ट को संभाल नहीं सकता है। यह कर सकते हैं? –

1

cookielib क्लाइंट साइड कुकी हैंडलिंग करता है, और mechanize कई मायनों में यह बढ़ाता है - से कुकीज़ को पढ़ कर एक तरह से एक कुकी जार प्रारंभ करने में शामिल हैं: यदि आप के लिए यह काम

1

पायथन समाधान नहीं है, लेकिन Chickenfoot जैसे ब्राउज़र स्वचालन उपकरण का उपयोग करने पर विचार करें।

+0

+1 वाह, इस एक्सटेंशन के बारे में कभी नहीं सुना ... interresting –

संबंधित मुद्दे