मैं वेब पेज को प्रोग्रामेटिक रूप से कैसे सहेजूं?

मैं प्रोग्रामिंग के जरिए एक वेब पेज सहेजना चाहता हूं।मैं वेब पेज को प्रोग्रामेटिक रूप से कैसे सहेजूं?

मेरा मतलब केवल HTML को सहेजना नहीं है। मैं स्वचालित रूप से सभी संबंधित फाइलों (छवियों, सीएसएस फ़ाइलों, शायद एम्बेडेड एसडब्ल्यूएफ, आदि) को स्टोर करना चाहूंगा, और उम्मीद है कि स्थानीय ब्राउज़िंग के लिए लिंक फिर से लिखना होगा।

इच्छित उपयोग एक व्यक्तिगत बुकमार्क एप्लिकेशन है, जिसमें मूल प्रतिलिपि के मामले में लिंक सामग्री को कैश किया जाता है।

wget -p http://<site>/1.html

page.html और ऐसा करना आवश्यक हो सभी फ़ाइलों को डाउनलोड:

स्रोत

2009-11-13 Joseph Turian

विशेष रूप से -p झंडा

−p −−page−requisites 
This option causes Wget to download all the ﬁles 
that are necessary to properly display 
a givenHTML page. Thisincludes such 
things as inlined images, sounds, and 
referenced stylesheets.

निम्न आदेश wget पर एक नजर डालें।

स्रोत

2009-11-13 22:36:22 Josh

और किसी ने मुझे क्यों गिरा दिया? मेरा मतलब है -1 -1 मुझे इतना परेशान नहीं करता है क्योंकि मैं अपने उत्तर के साथ किसी भी मुद्दे को सही करना चाहता हूं ... – Josh

यह बहुत अच्छा लगता है, सिवाय इसके कि आउटपुट पृष्ठ के समान नहीं दिखता है मैं नकल करता हूँ। उदाहरण के लिए, मैंने 'wget -p' की कोशिश की है http://ffffound.com/image/3d3795b5447291980a40f3719dea4b5b15ff3ec9 हालांकि, संबंधित छवियां जो क्षैतिज सूची के रूप में रखी गई हैं, अब एक लंबी लंबवत सूची बन जाती हैं, एक-प्रति-पंक्ति। क्यूं कर? –

विंडोज़ पर: आप आईई को कॉम ऑब्जेक्ट के रूप में चला सकते हैं और सब कुछ खींच सकते हैं।

दूसरी बात पर, आप मोज़िला का स्रोत ले सकते हैं।

जावा में, Lobo।

या कॉमन्स-httpclient और बहुत सारे कोड लिखें।

स्रोत

2009-11-13 22:37:42 bmargulies

+1 यदि आपको स्टाइलशीट्स और सीएसएस आयात में संदर्भित पृष्ठभूमि छवियों जैसी सामग्री की आवश्यकता है, तो आपको वास्तविक दुनिया HTML और CSS पार्सर की आवश्यकता है। यह पहले से ही आधा ब्राउज़र है, इसलिए आप इसे एक वास्तविक ब्राउज़र के साथ भी कर सकते हैं। IE को एम्बेड करना सबसे आसान है, या फ़ायरफ़ॉक्स एक्सटेंशन के रूप में काम करता है। – bobince

आप एमएचटीएम प्रारूप (जो आईई का उपयोग करता है) का प्रयास कर सकता है। http://en.wikipedia.org/wiki/MHTML

दूसरे शब्दों में, आप अपने कंप्यूटर पर प्रत्येक ऑब्जेक्ट (छवि, सीएसएस, इत्यादि) डाउनलोड कर रहे हैं, और फिर बेस 64 के माध्यम से, उन्हें एक फ़ाइल में "एम्बेडिंग" कर सकते हैं।

स्रोत

2009-11-13 22:37:53

मैं इसे कैसे प्रोग्राम करूं? –

आप किस प्रोग्रामिंग भाषा का उपयोग करना चाहते हैं? –

यहां एक है जो वीबी का उपयोग करता है: http://www.codeproject.com/KB/aspnet/aspnethtml2mht.aspx –

मैं वेब पेज को प्रोग्रामेटिक रूप से कैसे सहेजूं?

उत्तर

संबंधित मुद्दे