2009-11-23 21 views
22

आज इंटरनेट पर बहुत सारी सामग्री जावास्क्रिप्ट का उपयोग करके उत्पन्न होती है (विशेष रूप से पृष्ठभूमि AJAX कॉल द्वारा)। मैं सोच रहा था कि Google जैसे वेब क्रॉलर उन्हें कैसे संभालते हैं। क्या वे जावास्क्रिप्ट से अवगत हैं? क्या उनके पास एक अंतर्निहित जावास्क्रिप्ट इंजन है? या वे पृष्ठ में सभी जावास्क्रिप्ट जेनरेट की गई सामग्री को अनदेखा करते हैं (मुझे लगता है कि काफी संभावना नहीं है)। क्या लोग अपनी सामग्री को अनुक्रमित करने के लिए विशिष्ट तकनीकों का उपयोग करते हैं जो अन्यथा सामान्य इंटरनेट उपयोगकर्ता को पृष्ठभूमि AJAX अनुरोधों के माध्यम से उपलब्ध होगा?वेब क्रॉलर जावास्क्रिप्ट को कैसे संभालते हैं

+0

http://stackoverflow.com/questions/1739898/html-how-to-get- my-subpages-listings-on-a-google-search "सामग्री अनुक्रमित होने" के लिए यहां दिए गए उत्तरों देखें –

उत्तर

14

जावास्क्रिप्ट को बिंग और Google क्रॉलर दोनों द्वारा संभाला जाता है। याहू बिंग क्रॉलर डेटा का उपयोग करता है, इसलिए इसे भी संभाला जाना चाहिए। मैंने अन्य खोज इंजनों को नहीं देखा, इसलिए यदि आप उनकी परवाह करते हैं, तो आपको उन्हें देखना चाहिए।

  • बचें pushState
  • बचें दो बनाने के साथ टूटी कड़ियों बनाने:

    जावास्क्रिप्ट आधारित वेबसाइटों है कि उनके क्रॉलर (ज्यादातर pushState से संबंधित) है कि सामान्य रूप में अच्छी प्रथाओं के साथ काम बनाने के लिए कैसे करने के लिए के रूप में Bing published guidance in March 2014 विभिन्न लिंक जो pushState

  • cloaking से बचें। (Here's an article Bing published about their cloaking detection in 2007)
  • समर्थन ब्राउज़र (और क्रॉलर्स) जो pushState को संभाल नहीं सकते हैं।

कैसे जावास्क्रिप्ट आधारित वेबसाइटों है कि उनके क्रॉलर के साथ काम बनाने के लिए, और उनकी अनुशंसाओं को भी सलाह दी जाती है के रूप में Google later published guidance in May 2014:

  • robots.txt में जावास्क्रिप्ट (और सीएसएस) को ब्लॉक न करें फ़ाइल।
  • सुनिश्चित करें कि आप क्रॉलरों के भार को संभाल सकते हैं।
  • ब्राउज़र और क्रॉलर का समर्थन करना एक अच्छा विचार है जो संभाल नहीं सकता (या उपयोगकर्ता और संगठन जो अनुमति नहीं देंगे) जावास्क्रिप्ट
  • ट्रिकी जावास्क्रिप्ट जो आर्केन या भाषा की विशिष्ट विशेषताओं पर निर्भर करता है, क्रॉलर के साथ काम नहीं कर सकता ।
  • यदि आपकी जावास्क्रिप्ट पृष्ठ से सामग्री को हटा देती है, तो यह अनुक्रमित नहीं हो सकती है। के आसपास।
+0

क्या भविष्य वेब क्रॉलर की तरह दिखता है स्मार्ट बन जाएगा और AJAX पर अधिक ध्यान केंद्रित करेगा? –

+0

@ शैलेश - मैं यह निश्चित रूप से कहूंगा। वे यहां जावास्क्रिप्ट या AJAX- सक्षम साइटों को क्रॉल करने की चुनौतियों के बारे में कुछ बात करते हैं: http://searchengineland.com/google-io-new-advances-in-the-searchability-of-javascript-and-flash-but- यह पर्याप्त है-19881 –

+0

यह उत्तर बहुत पुराना है। Googlebot निश्चित रूप से अब जावास्क्रिप्ट को संभालता है: http://googlewebmastercentral.blogspot.com/2014/05/understanding-web-pages-better.html अन्य क्रॉलर के बारे में निश्चित नहीं है, लेकिन मेरा अनुमान है कि वे जल्द ही सूट का पालन करने की संभावना रखते हैं, अगर वे पहले से ही नहीं हैं। – Ajedi32

7

उनमें से अधिकतर किसी भी तरह से जावास्क्रिप्ट को संभाल नहीं पाते हैं। (कम से कम, सभी प्रमुख खोज इंजन 'क्रॉलर नहीं करते हैं।)

यही कारण है कि आपकी साइट जावास्क्रिप्ट के बिना नेविगेशन को नेविगेशन से संभाल लेना अभी भी महत्वपूर्ण है।

+0

दुर्भाग्य से, Google-bot निश्चित रूप से जावास्क्रिप्ट के अंदर क्रॉल कर रहा है ... [link] (http: // stackoverflow .com/प्रश्न/5749348/jquery-cause-404-error-in-webmaster-tools-on-a-directory) – Sparky

+0

क्या वे जावास्क्रिप्ट को संभाल नहीं पाते हैं, या क्या वे

2

निश्चित रूप से बेन एस ने क्या कहा। और लिंक्स के साथ आपकी साइट तक पहुंचने वाला कोई भी व्यक्ति जावास्क्रिप्ट को निष्पादित नहीं करेगा। यदि आपकी साइट सामान्य सार्वजनिक उपयोग के लिए है, तो इसे आम तौर पर जावास्क्रिप्ट के बिना प्रयोग योग्य होना चाहिए।

इसके अलावा, संबंधित: यदि ऐसे पृष्ठ हैं जिन्हें आप खोज इंजन चाहते हैं, और जो आमतौर पर केवल जावास्क्रिप्ट से उत्पन्न होता है, तो आप उनमें से स्थिर संस्करण उत्पन्न करने पर विचार कर सकते हैं, जो क्रॉल करने योग्य साइट मानचित्र द्वारा पहुंचा जा सकता है, जहां ये स्थिर पृष्ठ जावास्क्रिप्ट-सक्षम ब्राउज़र द्वारा मारा जाने पर वर्तमान संस्करण को लोड करने के लिए जावास्क्रिप्ट का उपयोग करते हैं (यदि ब्राउज़र वाला कोई मानव आपके साइट मानचित्र का अनुसरण करता है)। खोज इंजन पृष्ठ के स्थिर रूप को देखेगा, और इसे अनुक्रमित कर सकता है।

1

क्रॉलर यह पता लगाने के लिए जावास्क्रिप्ट को पार्स नहीं करते हैं कि यह क्या करता है।

उन्हें onchange="window.location.href=this.options[this.selectedIndex].value;" या onclick="window.location.href='blah.html';" जैसे कुछ क्लासिक स्निपेट को पहचानने के लिए बनाया जा सकता है, लेकिन वे AJAX का उपयोग करके प्राप्त सामग्री जैसी चीजों से परेशान नहीं हैं। कम से कम अभी तक नहीं, और इस तरह से प्राप्त सामग्री हमेशा वैसे भी माध्यमिक होगी।

तो, जावास्क्रिप्ट केवल अतिरिक्त कार्यक्षमता के लिए उपयोग किया जाना चाहिए। मुख्य सामग्री यह है कि आप क्रॉलर को ढूंढना चाहते हैं, फिर भी पृष्ठ में सादा पाठ होना चाहिए और नियमित लिंक जो क्रॉलर आसानी से अनुसरण कर सकते हैं।

3

मैंने अपनी साइट पर पृष्ठों को केवल जावास्क्रिप्ट द्वारा पहुंचा जा सकता है और फिर खोज अनुक्रमणिका में उनकी उपस्थिति देखकर इसका परीक्षण किया है।

मेरी साइट पर पेज जो केवल जावास्क्रिप्ट द्वारा पहुंचा जा सकता था, बाद में Google द्वारा अनुक्रमित किया गया था।

सामग्री जावास्क्रिप्ट के माध्यम से 'क्लासिक' तकनीक के साथ या एक यूआरएल बनाने और खिड़की को स्थापित करने के माध्यम से पहुंचा। स्थान के अनुसार। अगर वे 'htmlunit' या 'सेलेनियम' जैसी व्यवस्थाएं किसी तरह का प्रयोग कर रहे हैं

1

क्रॉलर्स जावास्क्रिप्ट या ajax संभाल कर सकते हैं कॉल

+0

क्या आप किसी भी क्रॉलर के बारे में जानते हैं जो ऐसा करते हैं? –

+0

किसी विशिष्ट क्रॉलर को नाम नहीं देना चाहते हैं, लेकिन यह संभव है। – Srikanth

संबंधित मुद्दे