2012-05-10 11 views
19

मेरे पास लेखकों की एक सूची है। मैं प्रत्येक लेखक के लिए स्वचालित रूप से (आदर्श वार्षिक) उद्धरण सूचकांक (एच-इंडेक्स, एम-क्वांटेंट, जी-इंडेक्स, एचसीपी सूचक या ...) को पुनः प्राप्त/गणना करना चाहता हूं।लेखकों की सूची से उद्धरण संख्याओं और/या उद्धरण सूचकांक को पुनः प्राप्त/गणना कैसे करें?

Author Year Index 
first 2000 1 
first 2001 2 
first 2002 3 

मैं इन प्रशस्ति पत्र दिया सभी मीट्रिक की गणना कर सकते हैं प्रत्येक शोधकर्ता की प्रत्येक पेपर के लिए मायने रखता है।

Author Paper Year Citation_count 
first 1 2000 1 
first 2 2000 2 
first 3 2002 3 

मेरे प्रयासों के बावजूद, मैं एक एपीआई इस के लिए सक्षम विधि scraping नहीं मिला है /।

मेरे संस्थान के पास वेब ऑफ साइंस सहित कई सेवाओं तक पहुंच है।

+3

http://bmb-common.blogspot.ca/2011/11/google-scholar-still-sucks.html में कुछ जानकारी है - विशेष रूप से, यदि आपके पास स्कोपस तक पहुंच है तो 'CITAN' पैकेज काफी शक्तिशाली दिखता है ; आर-ब्लॉगर्स पर हाल ही में कुछ पबमेड-स्क्रैपिंग पोस्ट भी हैं (चाहे यह आपके लिए काम करे या नहीं, इस पर निर्भर करता है कि आप अपने क्षेत्र में पबमेड कवरेज से खुश हैं या नहीं)। भले ही आप WoS को स्क्रैप कर सकें, इसकी सेवा की शर्तों से इसकी अनुमति नहीं है ... –

+0

@ बेन बोकर, सुझावों के लिए धन्यवाद, यह मुझे सही दिशा में इंगित करता है। –

+0

शायद यह एक समाधान बनाया जाएगा: http://ropensci.org/project-overview/ –

उत्तर

1

प्रभावी रूप से मुख्य समस्या citation graph बनाने के लिए है। एक बार जब आप चाहते हैं कि आप अपनी इच्छित मीट्रिक की गणना कर सकते हैं (उदा। h-index, g-index, PageRank)।

मान लीजिए कि आपके पास कागजात का संग्रह है (जिसे आपने किसी भी तरीके से पुनर्प्राप्त किया है) आप उनमें से प्रत्येक से उद्धरण निकाल सकते हैं और उद्धरण ग्राफ बना सकते हैं। आपको उपयोगी ParsCit, an open-source CRF Reference String and Logical Document Structure Parsing Package मिल सकता है जिसका उपयोग CiteSeerX द्वारा किया जाता है और यह बहुत अच्छा काम करता है।

संबंधित मुद्दे