2009-07-20 8 views
5

की तरह वहाँ अपनी साइट पर खोज इंजन या क्रॉलर्स पता लगाने के लिए कोई तरीका है। मैं व्यवस्थापक हम देखते हैं और खोज इंजन की अनुमति देते हैं और यह भी हम (गूगल बॉट की तरह) बॉट की अंतिम यात्रा को देख सकते हैं कर सकते हैं पर phpBB में देखा है।मेरी साइट पर खोज इंजन विज़िट का पता लगाने के लिए कैसे? phpBB

PHP में किसी भी स्क्रिप्ट? Google विश्लेषणात्मक या समान प्रकार का एप्लिकेशन नहीं। मुझे अपनी ब्लॉग साइट के लिए इसे लागू करने की ज़रूरत है, मुझे लगता है कि पता लगाने का कोई तरीका है?

उत्तर

10

आप या तो IP पते या 'उपयोगकर्ता-एजेंट' स्ट्रिंग बॉट या वेब ब्राउज़र आपको भेजे द्वारा जा सकते हैं।

जब Googlebot (या अन्य सभी अच्छी तरह से व्यवहार करने वाले रोबोट) आपकी वेबसाइट पर जाते हैं, तो वे आपको $ _SERVER ['HTTP_USER_AGENT'] वेरिएबल भेज देंगे जो पहचानता है कि वे क्या हैं। कुछ उदाहरण हैं:

Googlebot/2,1 (+ http://www.google.com/bot.html)

NutchCVS/0.8-देव (Nutch; http://lucene.apache.org/nutch/bot.html

Baiduspider + (+ http://www.baidu.com/search/spider_jp.html)

Mozilla/5.0 (X11, यू, लिनक्स i686; en-US) AppleWebKit/531.4 (KHTML, छिपकली की तरह)

आप इन वेबसाइटों पर कई और अधिक उदाहरण मिल सकते हैं: link text link text

फिर आप उन उपयोगकर्ता के एजेंट स्ट्रिंग की जांच करने और निर्धारित करता है, तो उपयोगकर्ता एक खोज इंजन है या नहीं करने के लिए PHP इस्तेमाल कर सकते हैं। मैं इस बार की तरह कुछ का उपयोग करें:

$searchengines = array(
    'Googlebot', 
    'Slurp', 
    'search.msn.com', 
    'nutch', 
    'simpy', 
    'bot', 
    'ASPSeek', 
    'crawler', 
    'msnbot', 
    'Libwww-perl', 
    'FAST', 
    'Baidu', 
    ); 
$is_se = false; 
foreach ($searchengines as $searchengine){ 
    if (!empty($_SERVER['HTTP_USER_AGENT']) and 
      false !== strpos(strtolower($_SERVER['HTTP_USER_AGENT']), strtolower($searchengine))) 
    { 
      $is_se = true; 
      break; 
    } 
} 
if ($is_se) { print('Its a search engine!'); } 

याद रखें कि कोई पहचान पद्धति (गूगल एनालिटिक्स या किसी अन्य आंकड़े पैकेज या अन्यथा) 100% सही होने जा रहा है। कुछ वेब ब्राउज़र आपको कस्टम उपयोगकर्ता-एजेंट स्ट्रिंग सेट करने की अनुमति देते हैं, और कुछ गलत व्यवहार करने वाले वेब क्रॉलर उपयोगकर्ता-एजेंट स्ट्रिंग को बिल्कुल भी नहीं भेज सकते हैं। हालांकि यह विधि शायद 95% + क्रॉलर/आगंतुकों के लिए प्रभावी हो सकती है।

+0

मुझे लगता है कि यह देख रहा था .... – coderex

0

गूगल एनालिटिक्स के विकल्प जो आप अपने डेटा रखने के लिए अनुमति देते हैं:

Piwik PHP में लागू किया और जीए के रूप में एक ही तरीके से संचालित किया जाता है । अन्य दो वेब सर्वर लॉग विश्लेषक हैं।

-2

Google Analytics आपको अपने साइट के लिए क्रॉल आँकड़े देखने दूँगी।

5
  1. आप अपने उपयोगकर्ता-एजेंट स्ट्रिंग का उपयोग करके उन्हें पहचानने का प्रयास कर सकते हैं। उनमें से एक सूची यहां पाया जा सकता: http://www.botsvsbrowsers.com/

    खोज इंजन शब्द क्रॉलर और रोबोट इस्तेमाल करते हैं।

  2. खोज इंजन लगभग एकमात्र इंटरनेट उपयोगकर्ता हैं जो robots.txt पर जाते हैं।

  3. कुछ आईपी GoogleBot की तरह बॉट होने के लिए जाने जाते हैं।

संबंधित मुद्दे