6

मैं प्रोग्रामिंग के जरिए एक वेब पेज सहेजना चाहता हूं।मैं वेब पेज को प्रोग्रामेटिक रूप से कैसे सहेजूं?

मेरा मतलब केवल HTML को सहेजना नहीं है। मैं स्वचालित रूप से सभी संबंधित फाइलों (छवियों, सीएसएस फ़ाइलों, शायद एम्बेडेड एसडब्ल्यूएफ, आदि) को स्टोर करना चाहूंगा, और उम्मीद है कि स्थानीय ब्राउज़िंग के लिए लिंक फिर से लिखना होगा।

इच्छित उपयोग एक व्यक्तिगत बुकमार्क एप्लिकेशन है, जिसमें मूल प्रतिलिपि के मामले में लिंक सामग्री को कैश किया जाता है।

wget -p http://<site>/1.html 

page.html और ऐसा करना आवश्यक हो सभी फ़ाइलों को डाउनलोड:

उत्तर

6

विशेष रूप से -p झंडा

−p −−page−requisites 
This option causes Wget to download all the files 
that are necessary to properly display 
a givenHTML page. Thisincludes such 
things as inlined images, sounds, and 
referenced stylesheets. 

निम्न आदेश wget पर एक नजर डालें।

+0

और किसी ने मुझे क्यों गिरा दिया? मेरा मतलब है -1 -1 मुझे इतना परेशान नहीं करता है क्योंकि मैं अपने उत्तर के साथ किसी भी मुद्दे को सही करना चाहता हूं ... – Josh

+0

यह बहुत अच्छा लगता है, सिवाय इसके कि आउटपुट पृष्ठ के समान नहीं दिखता है मैं नकल करता हूँ। उदाहरण के लिए, मैंने 'wget -p' की कोशिश की है http://ffffound.com/image/3d3795b5447291980a40f3719dea4b5b15ff3ec9 हालांकि, संबंधित छवियां जो क्षैतिज सूची के रूप में रखी गई हैं, अब एक लंबी लंबवत सूची बन जाती हैं, एक-प्रति-पंक्ति। क्यूं कर? –

2

विंडोज़ पर: आप आईई को कॉम ऑब्जेक्ट के रूप में चला सकते हैं और सब कुछ खींच सकते हैं।

दूसरी बात पर, आप मोज़िला का स्रोत ले सकते हैं।

जावा में, Lobo

या कॉमन्स-httpclient और बहुत सारे कोड लिखें।

+0

+1 यदि आपको स्टाइलशीट्स और सीएसएस आयात में संदर्भित पृष्ठभूमि छवियों जैसी सामग्री की आवश्यकता है, तो आपको वास्तविक दुनिया HTML और CSS पार्सर की आवश्यकता है। यह पहले से ही आधा ब्राउज़र है, इसलिए आप इसे एक वास्तविक ब्राउज़र के साथ भी कर सकते हैं। IE को एम्बेड करना सबसे आसान है, या फ़ायरफ़ॉक्स एक्सटेंशन के रूप में काम करता है। – bobince

0

आप एमएचटीएम प्रारूप (जो आईई का उपयोग करता है) का प्रयास कर सकता है। http://en.wikipedia.org/wiki/MHTML

दूसरे शब्दों में, आप अपने कंप्यूटर पर प्रत्येक ऑब्जेक्ट (छवि, सीएसएस, इत्यादि) डाउनलोड कर रहे हैं, और फिर बेस 64 के माध्यम से, उन्हें एक फ़ाइल में "एम्बेडिंग" कर सकते हैं।

+0

मैं इसे कैसे प्रोग्राम करूं? –

+0

आप किस प्रोग्रामिंग भाषा का उपयोग करना चाहते हैं? –

+0

यहां एक है जो वीबी का उपयोग करता है: http://www.codeproject.com/KB/aspnet/aspnethtml2mht.aspx –

संबंधित मुद्दे