मैं एक मनमानी Google खोज शब्द के लिए "एन एन परिणाम" संख्या को स्क्रैप करने में सक्षम होना चाहता हूं। Google स्क्रैपर्स के लिए काफी प्रतिरोधी है, जबकि यह थोड़ा सा काम करने का विकल्प हो सकता है, मैं विशेष रूप से पूछ रहा हूं कि ऐसा करने का बेहतर तरीका है या नहीं? शायद Google द्वारा प्रदान की गई एक पूर्ववर्ती API है जो इस आवश्यकता को पूरा करेगी?क्या Google खोज से "एन परिणाम" नंबर वापस करने का कोई प्रोग्रामेटिक तरीका है?
उत्तर
मैं स्क्रैपिंग का प्रयास नहीं करता क्योंकि इसके साथ कानूनी रूप से कानूनी अक्षमताएं हैं, लेकिन Google कस्टम खोज API का उपयोग करेंगे। आपको एक एपीआई कुंजी के साथ-साथ सीएक्स आईडी की आवश्यकता होगी (यह एक कस्टम सर्च इंजन के लिए एक आईडी है जिसे आप अपने Google खाते में सेट अप करेंगे)
एक बार आपके पास एपीआई और आपकी सीएक्स आईडी तक पहुंच हो, तो आप cse.list विधि से प्रश्न सबमिट कर सकते हैं और totalResults
के तहत प्रतिक्रिया में जो नंबर आप खोज रहे हैं उसे प्राप्त कर सकते हैं।
अपने कस्टम खोज इंजन को सेट अप और अनुकूलित करते समय आपको उन साइटों को परिभाषित करना होगा जिन्हें आप खोजना चाहते हैं। सौभाग्य से, आप * .com, * .net, आदि जैसे वाइल्डकार्ड जोड़ सकते हैं या पूरे वेब को खोजने के लिए इस पृष्ठ पर दिए गए निर्देशों का पालन कर सकते हैं: https://support.google.com/customsearch/answer/2631040?hl=en
मैंने उन सभी लिंक को शामिल किया है जिन पर आपको आगे बढ़ने की आवश्यकता होगी यह नीचे। एक बार आपके पास सीएक्स आईडी होने के बाद एपीआई सूची एक्सप्लोरर आज़माएं। यह आपको वास्तविक समय प्रतिक्रिया डेटा देगा जो आप जांच सकते हैं और साथ खेल सकते हैं।
https://developers.google.com/custom-search/json-api/v1/reference/cse/list
cse.list विधि एक्सप्लोरर:
Google कस्टम खोज एपीआई
https://developers.google.com/custom-search/
इस विधि/endpoint आप उपयोग करना चाहते जाएगा:
https://developers.google.com/apis-explorer/#p/customsearch/v1/search.cse.list
सेट करें और अपने कस्टम खोज इंजन प्रबंधन
https://cse.google.com/cse/manage/all
नोट: परिणाम निर्भर करता है आप कैसे अपने खोज इंजन कॉन्फ़िगर किया है थोड़ा भिन्न हो सकते हैं। मेरे पास * .com और * .net डोमेन पर जोर देने के साथ पूरे वेब को खोजने के लिए एक परीक्षण स्थापित किया गया है और मुझे "एन एन नतीजे" में Google द्वारा दिखाए जाने की तुलना में बड़ी संख्या मिल रही है। मुझे यकीन नहीं है कि आपको उस सटीक संख्या की आवश्यकता है, लेकिन वे इसे "इसके बारे में" बता रहे हैं, इसलिए यह पूरी तरह सटीक संख्या नहीं हो सकता है। मुद्दा यह है कि, सीएसई के साथ आपके पास इसे कॉन्फ़िगर करने के तरीके पर बहुत अधिक नियंत्रण है और आपको बहुत करीब पहुंचने में सक्षम होना चाहिए।
मान लें कि यह आपकी कस्टम खोज एपीआई है, क्या आपने JSON प्रतिक्रिया निकाय से totalResults
को सशर्त रूप से निकालने का प्रयास किया है?
आप क्वेरी पैरामीटर पर एक जाँच प्रदर्शन से है कि प्राप्त कर सकते हैं, (क्यू कहते हैं की सुविधा देता है)
if(q.equals("your string")){
var keyName = "totalResults";
var resp = json_encode($response);
delete resp.queries.<APIkey>[keyName];
}
नोट: संरचना keyName पता लगाने के लिए: totalResults से here
- 1. प्रोग्रामेटिक रूप से Google खोज परिणाम प्राप्त करें
- 2. Google खोज API - परिणाम
- 3. विधि से बेनामी प्रकार वापस करने का कोई तरीका है?
- 4. क्या YQL को HTML वापस करने का कोई तरीका है?
- 5. सफल होने पर कोई फ़ंक्शन से कोई त्रुटि वापस करने का बेवकूफ तरीका क्या है?
- 6. क्या जीबी को शून्य तरीकों से शून्य से वापस करने से रोकने का कोई तरीका है?
- 7. क्या टेक्स्टव्यू में प्रोग्रामेटिक रूप से पाठ का चयन करने का कोई तरीका है?
- 8. डिवाइस का फ़ोन नंबर प्रोग्रामेटिक रूप से
- 9. PHP खोज में Google खोज परिणाम पढ़ें?
- 10. पहला Google खोज परिणाम (एसईओ?)
- 11. Google खोज परिणाम पृष्ठ में खोज इनपुट
- 12. क्या Google "मुझे भाग्यशाली लगता है" परिणाम से जोड़ने का एक सतत तरीका है?
- 13. क्या "गिट लॉग-एन 100-200 से" करने का कोई तरीका है?
- 14. क्या Google खोज से खोज शब्द कैप्चर करना संभव है?
- 15. क्या किसी डेवलपर के Google Play Store ऐप्स से लिंक करने का कोई तरीका है?
- 16. किसी फोन नंबर को "पिंग" करने का कोई तरीका?
- 17. कोई पॉपअप फेंकता है जब खोज कोई परिणाम नहीं देती
- 18. क्या सबडोमेन से जेसन लोड करने का कोई तरीका है?
- 19. क्या खोजने का कोई त्वरित तरीका है (एन -1)! एन द्वारा विभाजित है?
- 20. iframe वैकल्पिक में Google खोज परिणाम
- 21. क्या विंडोज़ पर सी ++ में प्रोग्रामेटिक रूप से पर्यावरण पथ सेट करने का कोई तरीका है?
- 22. XAMARIN (सी #) - क्या एक टेक्स्ट व्यू प्रोग्रामेटिक रूप से रेखांकित करने का कोई तरीका है?
- 23. क्या आईओएस में प्रोग्रामेटिक रूप से ब्लूटूथ और/या वाईफाई टॉगल करने का कोई तरीका है?
- 24. क्या प्रोग्राम बार आइटम प्रोग्रामेटिक रूप से हाइलाइट करने का कोई तरीका है?
- 25. क्या प्रदर्शन रीफ्रेश दर प्रोग्रामेटिक रूप से प्राप्त करने का कोई तरीका है?
- 26. क्या एमडीबी प्रोग्रामेटिक रूप से कॉन्फ़िगर करने का कोई तरीका है?
- 27. एन के पूरक का नंबर कैसे खोजें?
- 28. क्या ऐसा करने का कोई तरीका है?
- 29. क्या एफ # दस्तावेज के पास उनके प्रकार से कार्यों की खोज करने का कोई तरीका है?
- 30. प्रोग्रामेटिक रूप से एंड्रॉइड एन
यह प्राप्त किया गया है परिणाम की वास्तविक गणना नहीं देता है, लेकिन एक बहुत ही प्रतिबंधित सबसेट है। यहां देखें: http://jsfiddle.net/gh/gist/library/pure/6130833/ – DhruvPathak
आपके द्वारा उपयोग किए गए सीएक्स आईडी के साथ आपने अपने खोज इंजन पर कौन से डोमेन कॉन्फ़िगर किए हैं? ऐसा लगता है कि यह केवल 'developers.google.com' खोज रहा है। खोज को विस्तृत करने के लिए आपको ऊपर वर्णित वाइल्डकार्ड डोमेन जोड़ना होगा। –
एक Google उदाहरण है, लेकिन मैं जो कह रहा हूं वह है कि बहुत सारे वाइल्डकार्ड डोमेन वेब के बहुत सारे अंश को याद करेंगे। – DhruvPathak