2010-05-30 15 views
5

मैं किसी भी वेब पेज को पृष्ठ के तार्किक प्रतिनिधित्व में उलटा करना चाहता हूं। उदाहरण के लिए, यदि किसी वेब पेज में मेनू है, तो मैं शायद XML में लॉजिकल मेनू संरचना चाहता हूं। यदि वेबपृष्ठ में कोई आलेख है, तो मुझे एक आलेख एक्सएमएल नोड चाहिए, अगर उसके पास आलेख का शीर्षक है तो मैं एक शीर्षक एक्सएमएल नोड चाहता हूं। असल में, मैं किसी भी उपयोगकर्ता इंटरफ़ेस के बिना वेब पेज का तार्किक रूप चाहता हूं।रिवर्स इंजीनियर एक वेब पेज

यह तार्किक मॉडल या तो कोड या एक्सएमएल में ऑब्जेक्ट्स हो सकता है इससे कोई फर्क नहीं पड़ता, महत्वपूर्ण हिस्सा यह है कि यह पता चला है कि पृष्ठ पर सब कुछ क्या है।

उत्तर

3

लगता है कि आप जो चाहते हैं उसे एक पृष्ठ की सामग्री को वर्गीकृत करने की आवश्यकता होती है।

यह स्वचालित हो सकता है, हालांकि इसमें झूठे सकारात्मक होंगे और हर मामले में काम नहीं करेंगे।

उदाहरण के लिए, क्या होगा यदि एक पृष्ठ ने मेनू के लिए ul का उपयोग किया और दूसरा एक टेबल सेल का उपयोग करता था?

क्या आप इसे विशेष रूप से एक साइट या इंटरनेट पर किसी भी साइट के लिए चाहते हैं?

0

कैसे पृष्ठ पर पहले से ही XML पार्स करने के बारे में, देखने के

http://en.wikipedia.org/wiki/XHTML

+3

मैं भी पता चलता है कि वह एक्सएचटीएमएल करने के लिए पूरे इंटरनेट धर्मान्तरित जा रहा था;) – Onots

+0

बनाता है मुझे उस Windows के GIF लगाना चाहते हैं हस्तांतरण संवाद 'इंटरनेट डाउनलोड करना ...' – alex

+2

@alex - http://www.gifbin.com/982378 :) हालांकि, आकार अब थोड़ा छोटा लगता है .... –

संबंधित मुद्दे