2009-08-20 11 views
7

Googlebot कभी-कभी खराब क्वेरी स्ट्रिंग पैरामीटर वाली हमारी साइटों में से एक को अनुक्रमणित कर रहा है। मुझे यकीन नहीं है कि यह क्वेरी स्ट्रिंग पैरामीटर कैसे प्राप्त कर रहा है (ऐसी कोई साइटें नहीं हैं जो हमें खराब लिंक से जोड़ती हैं, और हमारी साइट में कुछ भी खराब मूल्य डालने वाला नहीं है)। खराब पैरामीटर साइट को 500 त्रुटि फेंकने का कारण बनता है, जैसा कि हम उम्मीद करते हैं।Google (या Googlebot) एक पृष्ठ को 500 त्रुटि लौटने वाला पृष्ठ क्यों देगा?

मैं इस धारणा के तहत था कि Google उन पृष्ठों को अनुक्रमित नहीं करेगा जो 500 त्रुटि लौटाते हैं, लेकिन यह पता चला है कि यह है। तो अब मेरे पास दो प्रश्न हैं:

1) Googlebot यादृच्छिक खराब क्वेरी स्ट्रिंग मान क्यों डालेगा? (मुझे इस सवाल का जवाब वास्तव में परवाह नहीं है, लेकिन अगर हम इससे बचने के लिए कुछ कर सकते हैं, तो यह हमारी समस्या का समाधान करेगा।)

2) Google एक पृष्ठ को अनुक्रमित करेगा जो 500 त्रुटि देता है?

यहाँ गलत लिंक Googlebot बनाई गई है कि में से एक है और Google द्वारा सूचीबद्ध:

http://www.pbs.org/teacherline/catalog/browse/?sa=4&gb=baqhuxts&gb=20&gb=21&num=20&page=2&js=0&sa=1

बुरा पैरामीटर जीबी = baqhuxts है। पैरामीटर 'जीबी' एक पूर्णांक होने की उम्मीद है। यदि आप क्वेरी स्ट्रिंग से उस पैरामीटर को हटाते हैं तो आपको एक अच्छा कैटलॉग पेज दिखाना चाहिए।

nofollow और robots.txt समाधान के बारे में: [संशोधित]

मैं अब है कि मैं एक मूर्ख हूँ और एक मेटा टैग सूचकांक करने के लिए खोज रोबोट पेज कह डाला एहसास। यह करने के लिए एक बेवकूफ बात थी। मैं उनको हटा रहा हूँ। डब्ल्यू (

आप तो आप पाएंगे कि यह यह बुरा पैरामीटर के साथ 10 पृष्ठों को अनुक्रमित है search on Google for 'baqhuxts'। लेकिन इन पृष्ठों में से प्रत्येक एक 500 त्रुटि देता है। किसी को भी के बारे में क्यों गूगल का मानना ​​है कि इन सूचकांक करने के लिए मान्य पृष्ठों हैं अंतर्दृष्टि है तो?

+0

विशेष रूप से क्वेरी स्ट्रिंग में क्या गलत है? यही है, वैध परिणाम प्राप्त करने के लिए उस यूआरआई में किसी को क्या बदलना होगा? यह समझाने में मदद कर सकता है कि क्या हो रहा है। – VoteyDisciple

+0

अच्छी पकड़ @ voteydisciple। मैंने क्वेरी स्ट्रिंग में क्या गलत है इसका एक स्पष्टीकरण जोड़ा। 'जीबी' परम एक पूर्णांक होने की उम्मीद है। – shawnr

+0

वेबसाइट के निचले भाग पर कॉपीराइट एक वर्ष है। – Davis

उत्तर

4

यह शायद इसलिए है क्योंकि आप अपने मेटा टैग में इस होने से यह सूचकांक करने के लिए गूगल कह रहे हैं:

<meta name="robots" content="index,follow"> 

कि निकालकर देखें! :)

+0

धन्यवाद, दान! – shawnr

1

दुर्भाग्य से मैं # 1 के लिए एक ही जवाब पता:।

गूगल उस तरह अजीब पेजों को क्रॉल क्योंकि गूगल टूलबार के साथ लोगों को उन पृष्ठों को न अस्तित्व के लिए जाते हैं, और उनके ब्राउज़िंग जानकारी Google को प्रेषित किया जाता है जाएगा इसी कारण आपको होगा है अक्सर उन अनुक्रमित पृष्ठों को ढूंढें जिनके पास कोई व्यवसाय अनुक्रमित नहीं है, उदाहरण के लिए, phpmyadmin पेज जो कहीं से भी जुड़े नहीं हैं।

+0

मैं समझता हूं कि आप जो वर्णन करते हैं वह होता है, और यह वास्तव में एक मुश्किल बात हो सकती है। लेकिन कृपया अद्यतन प्रश्न देखें - मैं कैटलॉग यूआरएल पर किसी भी बोर्ड को अस्वीकार नहीं करना चाहता हूं। या आप कह रहे हैं कि मेरे 500 पृष्ठ में रोबोट इंडेक्सिंग को अस्वीकार करने वाला मेटा टैग होना चाहिए? – shawnr

संबंधित मुद्दे