2014-07-21 5 views
5

किया था, मैं एक बहुत ही उपयोगी सुविधा को देखते हैं। जब मैं "लेख" पर क्लिक किया, यह मेरे पेज का एक बहुत सही मुख्य सामग्री देता है। परिणाम देख जब मैं पेज https://developer.chrome.com/extensions/api_index extract article in a pageकैसे पता लगाने के लिए जब मैं <a href="https://chrome.google.com/webstore/detail/evernote-web-clipper/pioclpoplcdbaefihamjohnefbikjilc" rel="noreferrer">Evernote clipper extension</a> साथ की कोशिश की Evernote क्लिपर की तरह मुख्य लेख टैग

मैं मुख्य लेख कि Evernote क्षेत्र बाहर, कई पृष्ठों में, लेख पहला लेख टैग से निकाला वास्तव में है को देखा साथ Evernote क्लिपर इस्तेमाल किया करते हैं। हालांकि evernote क्लिपर अभी भी पृष्ठों के साथ अच्छी तरह से काम करता है उस तरह के टैग का उपयोग नहीं करता है।

मुझे आश्चर्य है कि कैसे Evernote क्लिपर कि कर सकते हैं? क्या पृष्ठों की मुख्य सामग्री वाले मुख्य टैग का पता लगाने के लिए कोई जेएस लाइब्रेरी समर्थन है। क्या आप मुझे कुछ ऐसा करने की सलाह देता है दे सकते हैं।

अग्रिम धन्यवाद!

उत्तर

6

मेरी जानकारी से, वहाँ ऐसा करने के लिए कोई सार्वभौमिक js lib है। Evernote क्लिपर वेब पेज से "रोचक" सामग्री निकालने के लिए अपनी विधि का उपयोग करता है। आप प्रक्रिया को समझने की कोशिश करने के लिए Evernote क्लिपर के कोड का उपयोग कर सकते हैं।

पर मेरी मैक, क्रोम विस्तार के लिए पथ है:

~/Library/अनुप्रयोग समर्थन/गूगल/क्रोम/डिफ़ॉल्ट/एक्सटेंशन/pioclpoplcdbaefihamjohnefbikjilc/6.2_0/

यहाँ एक और उपकरण है जो बहुत काम करता है ज्यादा एक ही: https://www.readability.com/

आप भी इस धागे की जाँच कर सकते हैं: What algorithm does Readability use for extracting text from URLs?

या 'सामग्री extractio जैसे शब्दों के लिए गूगल पर खोज उदाहरण के लिए एन जेएस lib '। (मिले इस एक: https://github.com/hatena/extract-content-javascript)

आशा इस मदद करता है

+0

अपने suggession के लिए धन्यवाद। मैं परियोजना "पठनीयता" पर एक नज़र डाल रहा हूँ – yelliver

संबंधित मुद्दे