2010-07-20 10 views
22

मेरे एप्लिकेशन को प्रदत्त आईएसबीएन, शीर्षक, या लेखक के आधार पर प्रकाशित किसी भी पुस्तक के बारे में जानकारी पुनर्प्राप्त करने की आवश्यकता है। यह शायद ही एक अनूठी आवश्यकता है --- Amazon.com, Chegg.com जैसी साइटें, और बुक कलेक्टर जैसे सॉफ़्टवेयर भी आसानी से ऐसा करने में सक्षम हैं। लेकिन मैं इसे दोहराने में सक्षम नहीं हूं।पुस्तक मेटाडेटा कैसे प्राप्त करें?

स्पष्टीकरण के लिए, मुझे पुस्तकों के पूरे डेटाबेस को खोजने की आवश्यकता नहीं है --- केवल एक सीमित सबसेट जो एक पुस्तक संग्रह में इनपुट किया गया है। डेटाबेस बस मुझे पुस्तकों के उस सबसेट पर खोज को सक्षम करने के लिए आवश्यक मेटाडेटा के साथ इनपुट की गई पुस्तकों को टैग करने की अनुमति देगा। तो यहां मुद्दा मुद्दा नहीं है --- मेटाडेटा प्राप्त करना है।

विकल्प की कोशिश की है इस प्रकार हैं:

  1. परिमार्जन अमेज़न। नियमित अमेज़ॅन पृष्ठों को स्क्रैप करना लेखकों की तरह चीजों के लिए बहुत मजबूत नहीं था, और छोटे मोबाइल पृष्ठों को स्क्रैप करते समय तेज़ी से, उन्होंने निष्कर्षण की मजबूती के साथ समान मुद्दों को साझा किया। इसके अलावा, इसे एक एप्लिकेशन में बनाना अमेज़ॅन की सेवा की शर्तों का स्पष्ट उल्लंघन है।
  2. कांग्रेस पुस्तकालय स्क्रैप करें। हालांकि ऐसा लगता है कि कम कानूनी रैमिकेशंस हैं, आसानी और मजबूती फिर से समस्याएं थीं।
  3. ISBNdb.com API। हालांकि सेवा एक बिंदु तक मुक्त है, और आवश्यक मेटाडेटा लौटने का अच्छा काम करता है, मुझे दैनिक आधार पर 500 से अधिक पुस्तकों के लिए ऐसा करने की ज़रूरत है, जिस बिंदु पर इस सेवा के उपयोग के लिए आनुपातिक धन खर्च होता है। मैं एक मुफ्त या एक बार भुगतान समाधान पसंद करूंगा जो मुझे ऐसा करने की अनुमति देता है।
  4. Google पुस्तक डेटा API। हालांकि यह मुझे आवश्यक जानकारी प्रदान करने के लिए प्रतीत होता है, मैं पुस्तक पूर्वावलोकन को उनके सेवा की शर्तों के रूप में प्रदर्शित नहीं कर सकता।
  5. किताबों के डेटाबेस के लिए लाइसेंस खरीदें। उदाहरण के लिए, इंग्राम या बेकर & टेलर जैसी कंपनियां खुदरा विक्रेताओं और पुस्तकालयों को ये कैटलॉग प्रदान करती हैं। यह समाधान स्पष्ट रूप से महंगा है, इसलिए मुझे उम्मीद है कि एक और अधिक सुरुचिपूर्ण समाधान है जिसे मैंने याद किया है। लेकिन यदि नहीं, और एसओ पर किसी को किसी विशेष डेटाबेस के साथ अच्छा अनुभव हुआ है, तो मैं इसके साथ जाने के लिए तैयार हूं।

मैंने विस्तार से अपने दृष्टिकोण का वर्णन करने की कोशिश की है ताकि कम पुस्तकों वाले अन्य उपरोक्त समाधानों का लाभ उठा सकें। लेकिन मेरी आवश्यकताओं को देखते हुए, मैं पुस्तक मेटाडेटा को पुनः प्राप्त करने के लिए अपने विट्स एंड एंड पर हूं, इसलिए किसी भी पॉइंटर्स की बहुत सराहना की जाती है।

+0

क्या आपने [गुड्रेड्स एपीआई] (https://www.goodreads.com/api) कोशिश की? – Veenit

उत्तर

4

चूंकि यह संभावना नहीं है कि आपको हर दिन 500 किताबें पुनर्प्राप्त करनी होंगी: डेटाबेस में isbndb.com से पुनर्प्राप्त डेटा संग्रहीत करें और पुस्तक द्वारा पुस्तक को भरें।

+0

मैं यह करना चाहता हूं, लेकिन जब भी मैं डेटाबेस में बड़ी (~ 30,000) सूची लोड करता हूं, प्रति दिन 500 पुस्तकों की सीमा एक महत्वपूर्ण बाधा है। या तो एक एपीआई को एक साथ रखने या किसी मौजूदा डेटाबेस तक पहुंच खरीदने के लिए आदर्श होगा, जिसे मैं लुकअप की संख्या के बिना सीमा के बिना उपयोग कर सकता हूं। – Saketh

+0

उस उच्च संख्या में आइटम के साथ ऐसा लगता है कि आप पेशेवर मार्ग पर जा रहे हैं। मुझे संदेह है कि कोई भी सेवा आपको मूल रूप से उनके भुगतान (गंभीर) पैसे के भुगतान के बिना अपने डेटाबेस को क्लोन करने देगी। – akira

+0

मुद्दा यह है कि इनपुटिंग खराब हो गई है (उदाहरण के लिए 10,000 किताबें एक बार, फिर कुछ समय के लिए नहीं), लेकिन इनपुट एक बार में किया जाना चाहिए। – Saketh

1

ऐसा लगता है के रूप में, पुस्तकालयों और अन्य संगठनों का एक बहुत इस तरह के "आई" मशीन पठनीय सूचीबद्ध उर्फ ​​MARC के माध्यम से उपलब्ध है, आप इसे here बारे में अधिक जानकारी के रूप में अच्छी तरह से पा सकते हैं के रूप में जानकारी हो।

अब खोज के लिए "सही" शब्द जानने के लिए मैंने WorldCat.org खोजा।

हो सकता है कि इस पूरे मार्क बात आप एक विचार :)

+0

एमएआरसी रिकॉर्ड्स का उपयोग करके इस मुद्दे को हल करने के लिए कोई उचित खुला या भुगतान नहीं किया गया है, क्योंकि वर्ल्डकैट जैसी साइटों को आम तौर पर उनकी खोज एपीआई तक पहुंचने के लिए लाइब्रेरी की आवश्यकता होती है। मैं आश्चर्यचकित हूं, क्योंकि कोई सोचता है कि पुस्तकों की सार्वजनिक सूची ढूंढना आसान होगा! – Saketh

+0

ताकि आप खोज एपीआई (http://worldcat.org/devnet/wiki/SearchAPIDetails) का उपयोग नहीं कर सकें? – akira

+0

वर्ल्डकैट एपीआई एक एक्सेस कुंजी का उपयोग करता है - मैंने एक से अनुरोध किया है, लेकिन अगर मुझे एक स्वतंत्र समाधान मिल सकता है जो बहुत अच्छा होगा। – Saketh

4

एक नई तरह की बजाय अमेज़न scraping के देता है, आप API का उपयोग कर सकते हैं कि वे अपने संबद्ध कार्यक्रम के लिए बेनकाब: https://affiliate-program.amazon.com/gp/advertising/api/detail/main.html

यह 3k के बारे में अनुरोध की अनुमति देता है प्रति घंटे और अच्छी तरह से गठित एक्सएमएल देता है। यह आपको उस पुस्तक के लिंक को सेट करने की आवश्यकता है जिसके बारे में आप जानकारी दिखाते हैं, और आपको यह अवश्य कहना होगा कि आप एक संबद्ध भागीदार हैं।

संबंधित मुद्दे