2010-08-13 20 views
7

मुझे एएसपी.Net 4 वेबसाइट मिली है। मैं पृष्ठभूमि में आगंतुकों की गिनती कर रहा हूं लेकिन मेरा कोड सर्च इंजन के बॉट्स को भी गिना जाता है। मैं कैसे समझ सकता हूं कि मेरा ग्राहक एक बॉट या इंसान है? मैं बॉट गिनना नहीं चाहता।एएसपी.NET आगंतुकों की गिनती, बॉट

सादर

+0

उन पृष्ठों में से किसी एक के नीचे एक लिंक चिपकाएं जो किसी भी सही दिमाग में नहीं जाना चाहती - एक बॉट के अलावा। :) –

+0

लेकिन यदि आपकी साइट उन लिंकों में से एक है, तो क्या होगा? : -पी – LesterDove

उत्तर

4

आप खोज इंजन बॉट फ़िल्टर करने के लिए Request.Browser की Crawler संपत्ति का उपयोग कर सकते हैं।

+0

मुझे इसे देखना होगा। डी 'ओह! – LesterDove

+0

यह केवल सहायक होगा यदि आप लॉग को पार्स करने या अन्यथा जांच के बजाए अनुरोधों को रिकॉर्ड कर रहे हैं। इसके अलावा, अच्छा विचार। – cHao

+0

हाय, मैंने इस विधि की कोशिश की लेकिन यह मेरे लिए काम नहीं किया। क्या आपके पास एक और विचार है? मेरा कोड इस तरह है। यदि (! नया सत्र) वापसी; अगर (Request.Browser.Crawler) वापसी; अद्यतन विजिटर काउंटर(); – user348357

0

आप User Agent जांच कर सकता है और उसके बाद प्रकार R जो एक रोबोट या क्रॉलर है के लिए देखो।

अधिक जानकारी के लिए http://www.user-agents.org देखें।

मुझे यकीन है कि ऐसे मामले हैं जहां बॉट मानक का पालन नहीं कर रहे हैं और आपको उन लोगों में से एक को छोड़ना पड़ सकता है।

0

आपका सबसे अच्छा शर्त शायद ग्राहक के उपयोगकर्ता एजेंट जाँच कर रहा है:

http://support.microsoft.com/kb/306576

यहां तक ​​कि एक त्वरित छोटे पुस्तकालय वहाँ नेट के लिए अच्छी तरह से ज्ञात उपयोगकर्ता एजेंट या अच्छा regexps उपयोग करने के लिए की एक बहुत कुछ के साथ हो सकता है । ध्यान दें कि कुछ बॉट नकली उपयोगकर्ता एजेंट भेज देंगे ताकि वे ऐसा दिख सकें कि वे लोग हैं, कुछ लोग ब्राउज़र खाली या अज्ञात उपयोगकर्ता एजेंट भेज सकते हैं, आदि। लेकिन उन मामलों के बीच कुछ और बहुत दूर होना चाहिए। अधिकांश भाग के लिए आपको बहुत अच्छे आंकड़े मिलेंगे।

0

आप स्टार्टर्स के लिए संदेश शीर्षलेख में User Agent को आजमा सकते हैं और निरीक्षण कर सकते हैं। हालांकि, एक दुर्भावनापूर्ण बॉट नकली होगा। एक और श्रम गहन दृष्टिकोण आपके आईपी विज़िट को प्रोग्रामेटिक रूप से लॉग इन/निरीक्षण करना है (वेब ​​लॉग फाइलों में देखें, या स्वयं को इकट्ठा करें) और उनमें से कौन सा दौरा आवृत्ति के आधार पर बॉट हैं, आदि। बिल्ली और माउस गेम काफी ।

0

आप कुछ लिंक तक पहुँचने से क्रॉलर बाधित करना, की तरह कुछ के साथ, अपने रूट निर्देशिका में robots.txt फ़ाइल बनाने चाहते हैं:

User-agent: * 
Disallow:/// blocks the default route/page 
Disallow: /MyPage.aspx 

जांच

http://en.wikipedia.org/wiki/Robots_exclusion_standard

&

http://www.google.com/#hl=en&q=robots.txt

संबंधित मुद्दे