मान लीजिए कि मैंने HTML कोड डाउनलोड किया है, और मैं इसे पार्स कर सकता हूं। मुझे उस वेबसाइट का "सर्वश्रेष्ठ" विवरण कैसे प्राप्त होगा, यदि उस वेबसाइट में मेटा-विवरण टैग नहीं है?पायथन में वेबसाइट का विवरण पाने का सबसे अच्छा तरीका क्या है?
उत्तर
उपरोक्त "पठनीयता" सुझाव (जो स्वयं वेबसाइट InstaPaper से प्रेरित है) पर अनुवर्ती करने के लिए, उन्होंने जावास्क्रिप्ट को जारी किया है: http://code.google.com/p/arc90labs-readability/। और क्या है, कुछ लड़के ने इसे लिया और इसे पायथन पर पोर्ट किया: http://github.com/gfxmonk/python-readability। आनन्द!
आप Readability जैसे कुछ से पहले कुछ वाक्य लौटा सकते हैं।
सफारी 5 इसे इस्तेमाल करता है, तो यह ठीक होना चाहिए :)
यह एक नियम है कि समय की 100% काम करता है, स्पष्ट रूप से साथ आने के लिए बहुत मुश्किल है, लेकिन एक प्रारंभिक बिंदु के रूप में अपने सुझाव देखने के लिए होगा पहले <h1>
टैग (या <h2>
, <h3>
, आदि के लिए - उच्चतम जो आप पा सकते हैं) तो के बाद पाठ का थोड़ा सा विवरण के रूप में उपयोग किया जा सकता है। जब तक साइट को अर्थात् चिह्नित किया जाता है, तो आपको एक अच्छा विवरण देना चाहिए (मुझे लगता है कि आप सामग्री<h1>
स्वयं भी ले सकते हैं, लेकिन यह "शीर्षक" जैसा अधिक है)।
यह ध्यान रखना दिलचस्प है कि Google (उदाहरण के लिए) एक स्थिर विवरण के बजाय वर्णन के रूप में प्रदर्शित करने के लिए पृष्ठ सामग्री के एक कीवर्ड-विशिष्ट निकास का उपयोग करता है। सुनिश्चित नहीं है कि यह आपकी स्थिति के लिए काम करेगा, हालांकि।
- 1. वेबसाइट पर वीडियो देने का सबसे अच्छा तरीका क्या है?
- 2. एसक्यूएल प्रश्नों के साथ अच्छा पाने का सबसे अच्छा तरीका
- 3. फ़ाइल का आकार पाने का एक अच्छा तरीका क्या है?
- 4. जेएस में तत्व का टैग नाम पाने का सबसे अच्छा तरीका क्या है?
- 5. पायथन प्रिंट टॉगल करने का सबसे अच्छा तरीका क्या है?
- 6. उबंटू पर spidermonkey js पाने का सबसे अच्छा तरीका?
- 7. क्लोजर में जीयूआई करने का सबसे अच्छा तरीका क्या है?
- 8. वेबसाइट के लिए लाटेक्स में टिल्डे का उत्पादन करने का सबसे अच्छा तरीका क्या है?
- 9. NumPy में यादृच्छिक संख्या पाने का सबसे अच्छा तरीका क्या है?
- 10. PHP में एक फ्लोट के आंशिक भाग को पाने का सबसे अच्छा तरीका क्या है?
- 11. ईमेल वेबसाइट प्राप्त करने का सबसे अच्छा तरीका
- 12. वेबसाइट पर एकाधिक भाषाओं का उपयोग करने का सबसे अच्छा तरीका क्या है?
- 13. हस्ताक्षर ऑनलाइन कैप्चर करने का सबसे अच्छा तरीका क्या है?
- 14. क्यूटी आवेदन में पायथन स्क्रिप्टिंग जोड़ने का सबसे अच्छा तरीका?
- 15. पायथन में बहुआयामी शब्दकोश परिभाषित करने का सबसे अच्छा तरीका?
- 16. जोइस लुकअप बनाने का सबसे अच्छा तरीका क्या है?
- 17. RedirectToAction का परीक्षण करने का सबसे अच्छा तरीका क्या है?
- 18. सबसे अच्छा तरीका है
- 19. एनएसएमयूटेबलएरे को शफल करने का सबसे अच्छा तरीका क्या है?
- 20. वर्तमान उपयोगकर्ता के एसआईडी को पाने का सबसे अच्छा तरीका क्या है?
- 21. ग्रैफेम पाने का सही तरीका क्या है?
- 22. सी # में अपवाद बढ़ाने का सबसे अच्छा तरीका क्या है?
- 23. विंडोज़ में बेंचमार्क प्रोग्राम का सबसे अच्छा तरीका क्या है?
- 24. सेलेनियम में पुनर्निर्देशन करने का सबसे अच्छा तरीका क्या है?
- 25. एमवीसी कोडिंग में संक्रमण का सबसे अच्छा तरीका क्या है?
- 26. वेक्टर में सूची पिघलने का सबसे अच्छा तरीका क्या है?
- 27. इंकस्केप में तीर बनाने का सबसे अच्छा तरीका क्या है?
- 28. नियुक्ति बुकिंग वेबसाइट बनाने का सबसे आसान तरीका क्या है?
- 29. तालिका को समर्पित करने का सबसे अच्छा तरीका क्या है?
- 30. फ्लोट पार्स करने का सबसे अच्छा तरीका?
पढ़ने योग्यता के लिए +1। साफ उपकरण। पठनीयता के लिए –
+1 :) – Kit