2012-08-10 14 views
5

मुझे विकिपीडिया एपीआई क्वेरी या किसी अन्य एपीआई जैसे कुछ संपत्तियों के साथ पृष्ठों की एक साधारण सूची के लिए पूछने के लिए opensearch का उपयोग करने की आवश्यकता है।गुणों के साथ विकिपीडिया पेज क्वेरी

इनपुट: पृष्ठ (आलेख) शीर्षक या आईडी की एक सूची।
आउटपुट: (OpenSearch एपीआई में की तरह) (OpenSearch एपीआई में) की तरह
पेज आईडी
शीर्षक
टुकड़ा/विवरण
पेज यूआरएल
छवि यूआरएल

: जिन पेजों पर निम्नलिखित गुण प्रत्येक शामिल की एक सूची

इसके परिणामस्वरूप:
http://en.wikipedia.org/w/api.php?action=opensearch&search=miles%20davis&limit=20&format=xml
केवल पृष्ठ आईडी के साथ और खोज के लिए नहीं, बल्कि शीर्षक या पेजिड्स द्वारा पृष्ठों की सटीक सूची।

यह एक काफी साधारण बात होनी चाहिए लेकिन मैं बिना किसी सफलता के मेगावाट एपीआई मैनुअल से सभी प्रकार के यूआरएल संयोजनों को आजमाने के लिए इसके साथ अटक गया हूं।

उत्तर

2

मुझे नहीं लगता कि ओपन सर्च डेटा लाने के लिए Open Search API से एक और तरीका है, लेकिन आप जिस विकिपीडिया में रूचि रखते हैं उसके आधार पर, आपकी सहायता के लिए अन्य एक्सटेंशन इंस्टॉल हो सकते हैं। एक उदाहरण के रूप में अंग्रेजी विकिपीडिया लेते हुए, हम MobileFrontend और PageImages एक्सटेंशन का उपयोग कर सकते हैं, जो be installed there पर होता है।

  • शीर्षक और यूआरएल देशी मीडियाविकि एपीआई से उपलब्ध हैं। यूआरएल पाने के लिए आपको prop=info उपयोग कर सकते हैं, और inprop=url साथ निर्दिष्ट है कि यह यूआरएल आप में रुचि रखते हैं है।
  • प्रमुख छवियों को एक पेज के PageImages को, prop=pageimages द्वारा दिया जाता है धन्यवाद।
  • मोबाइलफ्रंटेंड extracts नामक एक संपत्ति को जोड़ता है, जिसे आप निर्देश पहले पैराग्राफ प्राप्त करने के लिए निर्देश के साथ उपयोग कर सकते हैं। ध्यान दें कि MediWiki मार्कअप जटिल है, और परिणाम हमेशा सही नहीं हो सकता है।

http://en.wikipedia.org/w/api.php?action=query&pageids=21482&prop=pageimages|info|extracts&inprop=url&exintro

इस दे रही है:

<api> 
    <query> 
    <pages> 
     <page pageid="21482" ns="0" title="Nairobi" pageimage="Nairobi_Montage.jpg" contentmodel="wikitext" pagelanguage="en" touched="2014-02-06T06:10:01Z" lastrevid="594161616" counter="" length="89157" fullurl="http://en.wikipedia.org/wiki/Nairobi" editurl="http://en.wikipedia.org/w/index.php?title=Nairobi&amp;action=edit"> 
     <thumbnail source="http://upload.wikimedia.org/wikipedia/commons/thumb/6/66/Nairobi_Montage.jpg/45px-Nairobi_Montage.jpg" width="45" height="50" /> 
     <extract xml:space="preserve"> 
      &lt;p&gt;&lt;b&gt;Nairobi&lt;/b&gt; /naɪˈroʊbi/ is the [...] 
     </extract> 
     </page> 
    </pages> 
    </query> 
</api> 
0

यहाँ एक multistep प्रक्रिया विकिपीडिया की एक सूची प्राप्त करना है तो हम यह सब एक ही क्वेरी में एक साथ रखा, यह कुछ इस तरह होगा लेखों के लिए पृष्ठ शीर्षक और गुण, और फिर पृष्ठ आईडी और यूआरएल प्राप्त करना।

कृपया ध्यान दें: यह पिछले उत्तर के एक हिस्से का उपयोग करता है: "शीर्षक और यूआरएल मूल मीडियाविकि एपीआई से उपलब्ध है। यूआरएल प्राप्त करने के लिए, आप prop = info का उपयोग कर सकते हैं, और inprop = url के साथ निर्दिष्ट कर सकते हैं कि यह वह यूआरएल है जिसमें आप रुचि रखते हैं।"

यदि आप अपने स्वयं के अनुप्रयोगों के लिए विकिपीडिया एपीआई का उपयोग करना चाहते हैं और किसी निश्चित विषय के बारे में लेखों की सूची प्राप्त करने के लिए विकिपीडिया खोजना चाहते हैं, और आप JSON प्रारूप में उत्तर चाहते थे, तो आप निम्न यूआरएल का उपयोग कर सकते हैं :
https://en.wikipedia.org/w/api.php?action=query&list=search&srsearch=REPLACE_ME_WITH_SEARCH_TOPIC&format=json&callback= ?

और अपनी आँखें दिक्कत यह है कि से परिणाम को पार्स कर रहे हैं, तो की जगह "? प्रारूप = json & कॉलबैक =" "formatversion = 2" निम्न उदाहरण की तरह साथ अपनी आँखों के लिए यह आसान बनाने के लिए:
https://en.wikipedia.org/w/api.php?action=query&list=search&srsearch=REPLACE_ME_WITH_SEARCH_TOPIC&formatversion=2

निम्नलिखित उदाहरण मुझे जेएसओएन प्रारूप में "थाईलैंड" के बारे में लेख शीर्षक और गुणों की बैच सूची देगा, और उसके बाद मैं उन लेखों के पृष्ठ आईडी और यूआरएल को खोजने के लिए परिणामी खिताब का उपयोग करूंगा।
यूआरएल चरण 1:
https://en.wikipedia.org/w/api.php?action=query&list=search&srsearch=thailand&format=json&callback=?

चरण 1 से, मैं चरण 2 के साथ, शीर्षक मैं जिसके परिणामस्वरूप JSON अंदर से जरूरत की सूची प्राप्त कर सकते हैं, मैं का उपयोग उन खिताब एक और एपीआई क्वेरी में चरण 1 में प्राप्त की (उर्फ चरण 2) परिणामस्वरूप जेएसओएन में उन लेखों के पेज आईडी और यूआरएल प्राप्त करने के लिए ... चरण 2 के परिणाम।

यहाँ चरण 1 के परिणामस्वरूप JSON से विकिपीडिया लेख खिताब कर रहे हैं:

  • थाईलैंड
  • थाईलैंड
  • की रूपरेखा थाईलैंड की
  • भूगोल
  • अर्थव्यवस्था थाईलैंड
  • में थाईलैंड
  • फुटबॉल की
  • दक्षिणी थाईलैंड
  • गोवे थाईलैंड के rnment
  • उत्तरी थाईलैंड
  • थाईलैंड की संस्कृति
  • थाईलैंड
  • के सिनेमा

यूआरएल चरण 2:
https://en.wikipedia.org/w/api.php?action=query&titles=Thailand|Outline%20of%20Thailand|Geography%20of%20Thailand|Economy%20of%20Thailand|Football%20in%20Thailand|Southern%20Thailand|Government%20of%20Thailand|Northern%20Thailand|Culture%20of%20Thailand|Cinema%20of%20Thailand&prop=info&inprop=url&format=json&callback=?

संबंधित मुद्दे