क्या ये सभी प्रकार की साइटें अवैध रूप से Google या अन्य खोज इंजन को स्क्रैप कर रही हैं?
जहां तक मैं कह सकता हूं कि एक वाणिज्यिक साइट के लिए यह डेटा प्राप्त करने का कोई 'कानूनी' तरीका नहीं है .. याहू! एपीआई (http://developer.yahoo.com/search/siteexplorer/V1/inlinkData.html) केवल गैर-वाणिज्यिक उपयोग के लिए है, याहू! बॉस स्वचालित क्वेरी आदि की अनुमति नहीं देता है
कोई विचार?हब्सपॉट ट्रैक इनबाउंड लिंक जैसी साइटें कैसे हैं?
उत्तर
उदाहरण के लिए, यदि आप गूगल के होमपेज पर सभी लिंक चाहते थे,
link:http://www.google.com
तो के लिए खोज करता है, तो आप सभी इनबाउंड लिंक पता लगाना चाहते हैं, तो आप बस अपनी वेबसाइट के पेड़ पार कर सकते हैं, और प्रत्येक के लिए आइटम जो पाता है, एक यूआरएल बनाएं। फिर Google के लिए पूछताछ करें:
link:URL
और आपको अन्य वेबसाइटों से Google की सभी वेबसाइटों का संग्रह मिल जाएगा।
ऐसी कटाई की वैधता के लिए, मुझे यकीन है कि इससे लाभ प्राप्त करने के लिए बिल्कुल कानूनी नहीं है, लेकिन इससे पहले कभी भी किसी को रोक नहीं दिया गया है, है ना?
(तो मैं सोच रहा है कि क्या वे यह किया है या नहीं। बस मान वे करते हैं परेशान नहीं होता।)
मैं, क्या HubSpot कर पता नहीं है, लेकिन यदि आप पता लगाने के लिए क्या साइटों से लिंक करना चाहता था आपकी साइट, और आपके पास वेब को क्रॉल करने के लिए हार्डवेयर नहीं है, एक चीज जो आप कर सकते हैं वह है आपकी साइट पर आगंतुकों के HTTP_REFERER की निगरानी करें। उदाहरण के लिए, Google Analytics (जहां तक मुझे पता है) आपको बता सकता है कि आपके आगंतुक कहां से आ रहे हैं। यह 100% विश्वसनीय नहीं है क्योंकि सभी ब्राउज़रों ने इसे विशेष रूप से "गोपनीयता मोड" में सेट नहीं किया है, लेकिन आपको यह जानने के लिए केवल एक विज़िटर प्रति लिंक चाहिए कि यह मौजूद है!
यह आपके प्रत्येक वेबपृष्ठों (अक्सर एक सामान्य शीर्षलेख या पाद लेख में) में एक स्क्रिप्ट एम्बेड करके पूरा किया जाता है। उदाहरण के लिए, यदि आप उस पृष्ठ के स्रोत की जांच करते हैं जिसे आप वर्तमान में पढ़ रहे हैं तो आपको एक स्क्रिप्ट मिलेगी (नीचे दाईं तरफ) एक स्क्रिप्ट जो आपकी यात्रा के बारे में Google की जानकारी को वापस रिपोर्ट करती है।
अब यह आपको नहीं बताएगा कि वहां कोई लिंक नहीं है, जिसने कभी भी आपकी साइट पर जाने के लिए उपयोग नहीं किया है, लेकिन चलो इसका सामना करते हैं, वे वास्तव में लोगों के उपयोग से बहुत कम दिलचस्प हैं।
बिल्कुल सही, मुझे लगता है - हब्सपॉट के नमूना स्क्रीनशॉट को देखते हुए, आप देख सकते हैं कि प्रत्येक ट्रैक किए गए इनबाउंड लिंक से इसके एक आगंतुक में है। विस्तार के लिए, रेफरर डेटा लॉग से प्राप्त किया जा सकता है या आपकी साइट में कुछ एम्बेडेड हो सकता है। –
- 1. लाइफकोर.com जैसी साइटें कैसे काम करती हैं?
- 2. मीबो स्टोर उपयोगकर्ता नाम और पासवर्ड जैसी साइटें कैसे हैं?
- 3. Google डॉक्स और ज़ोहो राइटर जैसी साइटें एमएस ऑफिस दस्तावेज
- 4. इनबाउंड मेल सेवा
- 5. ट्रैक टाइमस्टैम्प कैसे बनाते हैं
- 6. डिफ़ॉल्ट ग्रहण अद्यतन साइटें क्या हैं?
- 7. मेरी Azure साइटें क्यों चलती रहती हैं?
- 8. क्या जीवाश्म भंडार होस्टिंग साइटें हैं?
- 9. लिंक-टू-एसक्यूएल डेटाकॉन्टेक्स्ट पर क्वेरीज़ को कैसे ट्रैक करें
- 10. एलेक्सा और Google Analytics जनसांख्यिकीय ट्रैक कैसे करते हैं?
- 11. बड़ी साइटें पंक्ति-स्तर अनुमतियों को कैसे पूरा करती हैं?
- 12. बड़ी साइटें रखरखाव नोटिस पेज कैसे करती हैं?
- 13. टाइमज़ोन का पता लगाने वाली प्रमुख साइटें कैसे हैं?
- 14. Django प्रोजेक्ट में 2 अलग-अलग व्यवस्थापक साइटें कैसे हैं?
- 15. कौन सी साइटें लिंक करने के लिए सार्वजनिक वेब फ़ॉन्ट पुस्तकालय प्रदान करती हैं?
- 16. फेसबुक जैसी साइटें व्यक्तिगत प्रोफाइल के लिए डेटा स्टोर करने के लिए किस प्रारूप का उपयोग करती हैं?
- 17. क्या गिट ट्रैक संस्करण हैं?
- 18. Django में एकाधिक साइटें
- 19. ट्रैक
- 20. node.js पर कई साइटें चलाना
- 21. ट्रैक
- 22. क्या ईमेल हुक जैसी चीजें हैं?
- 23. टूटी हुई सुरक्षा चेतावनी वाले उदाहरण साइटें
- 24. अच्छी साइटें जो एमवीवीएम पैटर्न
- 25. आईपॉड-ट्रैक
- 26. एंड्रॉइड में हम पीपीटी, डॉक्टर, पीपीएस, आरटीएफ इत्यादि जैसी फाइलें कैसे खोल सकते हैं?
- 27. मास्टर शाखा ट्रैक कैसे बनाएं?
- 28. सीएक्सएफ इनबाउंड और आउटबाउंड संदेश अलग लॉग फ़ाइल में लॉगिंग
- 29. क्या एक्सएमएल 2.0 जैसी कोई चीज है?
- 30. जेरा या ट्रैक?
वे सिर्फ वेब क्रॉल कर सकते हैं ... http://www.80legs.com/ जैसी साइटें इसे आसान बनाती हैं। –