मेरी साइट पर खोज इंजन विज़िट का पता लगाने के लिए कैसे? phpBB

की तरह वहाँ अपनी साइट पर खोज इंजन या क्रॉलर्स पता लगाने के लिए कोई तरीका है। मैं व्यवस्थापक हम देखते हैं और खोज इंजन की अनुमति देते हैं और यह भी हम (गूगल बॉट की तरह) बॉट की अंतिम यात्रा को देख सकते हैं कर सकते हैं पर phpBB में देखा है।मेरी साइट पर खोज इंजन विज़िट का पता लगाने के लिए कैसे? phpBB

PHP में किसी भी स्क्रिप्ट? Google विश्लेषणात्मक या समान प्रकार का एप्लिकेशन नहीं। मुझे अपनी ब्लॉग साइट के लिए इसे लागू करने की ज़रूरत है, मुझे लगता है कि पता लगाने का कोई तरीका है?

स्रोत

2009-07-20 coderex

आप या तो IP पते या 'उपयोगकर्ता-एजेंट' स्ट्रिंग बॉट या वेब ब्राउज़र आपको भेजे द्वारा जा सकते हैं।

जब Googlebot (या अन्य सभी अच्छी तरह से व्यवहार करने वाले रोबोट) आपकी वेबसाइट पर जाते हैं, तो वे आपको $ _SERVER ['HTTP_USER_AGENT'] वेरिएबल भेज देंगे जो पहचानता है कि वे क्या हैं। कुछ उदाहरण हैं:

Googlebot/2,1 (+ http://www.google.com/bot.html)

NutchCVS/0.8-देव (Nutch; http://lucene.apache.org/nutch/bot.html

Baiduspider + (+ http://www.baidu.com/search/spider_jp.html)

Mozilla/5.0 (X11, यू, लिनक्स i686; en-US) AppleWebKit/531.4 (KHTML, छिपकली की तरह)

आप इन वेबसाइटों पर कई और अधिक उदाहरण मिल सकते हैं: link text link text

फिर आप उन उपयोगकर्ता के एजेंट स्ट्रिंग की जांच करने और निर्धारित करता है, तो उपयोगकर्ता एक खोज इंजन है या नहीं करने के लिए PHP इस्तेमाल कर सकते हैं। मैं इस बार की तरह कुछ का उपयोग करें:

$searchengines = array(
    'Googlebot', 
    'Slurp', 
    'search.msn.com', 
    'nutch', 
    'simpy', 
    'bot', 
    'ASPSeek', 
    'crawler', 
    'msnbot', 
    'Libwww-perl', 
    'FAST', 
    'Baidu', 
    ); 
$is_se = false; 
foreach ($searchengines as $searchengine){ 
    if (!empty($_SERVER['HTTP_USER_AGENT']) and 
      false !== strpos(strtolower($_SERVER['HTTP_USER_AGENT']), strtolower($searchengine))) 
    { 
      $is_se = true; 
      break; 
    } 
} 
if ($is_se) { print('Its a search engine!'); }

याद रखें कि कोई पहचान पद्धति (गूगल एनालिटिक्स या किसी अन्य आंकड़े पैकेज या अन्यथा) 100% सही होने जा रहा है। कुछ वेब ब्राउज़र आपको कस्टम उपयोगकर्ता-एजेंट स्ट्रिंग सेट करने की अनुमति देते हैं, और कुछ गलत व्यवहार करने वाले वेब क्रॉलर उपयोगकर्ता-एजेंट स्ट्रिंग को बिल्कुल भी नहीं भेज सकते हैं। हालांकि यह विधि शायद 95% + क्रॉलर/आगंतुकों के लिए प्रभावी हो सकती है।

स्रोत

2009-07-20 16:50:53

मुझे लगता है कि यह देख रहा था .... – coderex

गूगल एनालिटिक्स के विकल्प जो आप अपने डेटा रखने के लिए अनुमति देते हैं:

Piwik PHP में लागू किया और जीए के रूप में एक ही तरीके से संचालित किया जाता है । अन्य दो वेब सर्वर लॉग विश्लेषक हैं।

स्रोत

2009-07-20 16:10:49 oggy

-2

Google Analytics आपको अपने साइट के लिए क्रॉल आँकड़े देखने दूँगी।

स्रोत

2009-07-20 16:11:21 Galwegian

आप अपने उपयोगकर्ता-एजेंट स्ट्रिंग का उपयोग करके उन्हें पहचानने का प्रयास कर सकते हैं। उनमें से एक सूची यहां पाया जा सकता: http://www.botsvsbrowsers.com/

खोज इंजन शब्द क्रॉलर और रोबोट इस्तेमाल करते हैं।
खोज इंजन लगभग एकमात्र इंटरनेट उपयोगकर्ता हैं जो robots.txt पर जाते हैं।
कुछ आईपी GoogleBot की तरह बॉट होने के लिए जाने जाते हैं।

स्रोत

2009-07-20 16:51:42

Piwik Device Detector library का उपयोग करें।

यह a plethora of bots और स्वचालित निगरानी सेवाओं का स्वतः पता लगाता है।

स्रोत

2015-06-19 11:54:04

मेरी साइट पर खोज इंजन विज़िट का पता लगाने के लिए कैसे? phpBB

उत्तर

संबंधित मुद्दे