मैं सिर्फ सामग्री प्राप्त करना चाहता हूं (कोई लिंक नहीं, कोई श्रेणियां नहीं, कोई छवि नहीं ... केवल टेक्स्ट)विकिपीडिया पेज (विकिपीडिया एपीआई के माध्यम से) के HTML सामग्री टेक्स्ट को कैसे प्राप्त करें?
उत्तर
विकिपीडिया API से "केवल टेक्स्ट" प्राप्त करने का कोई तरीका नहीं है। आप या तो पेज के एचटीएमएल को डाउनलोड कर सकते हैं (यदि आप api.php की बजाय index.php के माध्यम से ऐसा करते हैं, तो सभी त्वचा सामग्री डाउनलोड करने से बचने के लिए action=render
का उपयोग करें) या विकीटेक्स्ट (जिसे आप एपीआई के माध्यम से कर सकते हैं या action=raw
से गुजरकर index.php); इसके बाद आपको उन बिट्स को हटाने के लिए खुद को पार्स करना होगा जिन्हें आप रखना नहीं चाहते हैं।
एचटीएमएल आउटपुट में, मीडियाविकि आमतौर पर विभिन्न इंटरफ़ेस तत्वों को कक्षाओं को जोड़ने के बारे में अच्छा होता है जिन्हें आप फ़िल्टर करना चाहते हैं; टेम्पलेट्स और ऐसे उपयोगकर्ताओं द्वारा बनाए गए शायद कम हैं (उदा। hack for table sorting बस कुछ पाठ display:none
अवधि, कोई कक्षा में नहीं डालता है)।
एपीआई के माध्यम से विकीटेक्स्ट प्राप्त करने के लिए, prop=revisions
का उपयोग करें। प्रस्तुत एचटीएमएल प्राप्त करने के लिए, action=parse
का उपयोग करें।
- 1. विकिपीडिया
- 2. विकिपीडिया के एपीआई का उपयोग करके विकिपीडिया सामग्री कैसे प्राप्त करें?
- 3. विकिपीडिया पेज
- 4. विकिपीडिया एपीआई
- 5. विकिपीडिया एपीआई
- 6. विकिपीडिया एपीआई - जेएसओएन ऑब्जेक्ट
- 7. गुणों के साथ विकिपीडिया पेज क्वेरी
- 8. मल्टी भाषाओं में विकिपीडिया पेज कैसे प्राप्त करें?
- 9. विकिपीडिया
- 10. विकिपीडिया से स्थिर HTML फ़ाइलों को प्राप्त करना XML डंप
- 11. पार्स विकिपीडिया
- 12. विकिपीडिया: जावा लाइब्रेरी विकिपीडिया टेक्स्ट मार्कअप हटाने को हटाने के लिए
- 13. विकिपीडिया लेख के नाम (कोई सामग्री नहीं)
- 14. विकिपीडिया पृष्ठ करने के लिए पेज pageid से लिंक
- 15. क्या विकिपीडिया डेटा
- 16. संपूर्ण विकिपीडिया को कैसे क्रॉल करें?
- 17. Mediawiki API द्वारा विकिपीडिया आलेख से इन्फोबॉक्स कैसे प्राप्त करें?
- 18. विकिपीडिया जैसे हाइपरलिंक्स के साथ प्रोग्रामेटिक रूप से HTML टेक्स्ट कैसे बनाएं?
- 19. विकिपीडिया एपीआई: किसी पृष्ठ के संशोधन की संख्या कैसे प्राप्त करें?
- 20. विकिपीडिया से संगीत कलाकार डेटा पुनर्प्राप्त करें?
- 21. विकिपीडिया आलेख (पायथन)
- 22. एक विकिपीडिया आलेख में पहला लिंक प्राप्त करें, जो कि
- 23. विकिपीडिया एपीआई से पूछताछ करें और भाषण का हिस्सा प्राप्त करें
- 24. विकिपीडिया से पार्स जन्म और मृत्यु तिथियां?
- 25. विकिपीडिया का सारांश लेख
- 26. एक विकिपीडिया डंप
- 27. निकटतम पड़ोसी - के-डी पेड़ - विकिपीडिया सबूत
- 28. विकिपीडिया सूची = खोज आरईएसटी एपीआई: मिलान लेखों के यूआरएल को पुनः प्राप्त करने के लिए कैसे करें
- 29. स्क्रैपिंग और एक विकिपीडिया को पार करना पृष्ठ
- 30. विकिपीडिया (मीडियाविकि) यूआरआई एन्कोडिंग योजना
ठीक है, लेकिन इसलिए मुझे पेज के शीर्ष पर विकिपीडिया सलाह भी मिलती है। इस तरह "इस आलेख को सत्यापन के लिए अतिरिक्त उद्धरण की आवश्यकता है।" .... "बस पाठ" कैसे प्राप्त करें? तीसरी लाइब्रेरी या एपीआई सेवा नहीं है? – Leonardo
@ लियोनार्डो: कोई एपीआई सेवा नहीं है; मुझे किसी तीसरे पक्ष की पुस्तकालय की जानकारी नहीं है। उस विशेष मामले में, आप wikitext से टेम्पलेट {{refimprove}} को बाहर निकाल सकते हैं, या आप HTML स्रोत से वर्ग 'मेटाडेटा' के साथ कुछ भी पट्टी कर सकते हैं। – Anomie