क्या फेसबुक ने कुछ वेब क्रॉलर को अभी लागू किया था? मेरी वेबसाइट पिछले कुछ दिनों में दो बार दुर्घटनाग्रस्त हो रही है, जो आईपी द्वारा गंभीर रूप से अधिभारित है जिसे मैंने फेसबुक पर वापस खोज लिया है।फेसबुक क्रॉलर बॉट क्रैशिंग साइट
मैंने चारों ओर घूमने की कोशिश की है लेकिन robots.txt के माध्यम से फेसबुक के क्रॉलर बॉट को नियंत्रित करने के संबंध में कोई निश्चित संसाधन नहीं मिल रहा है।
उपयोगकर्ता-एजेंट:: वहाँ निम्नलिखित जोड़ने पर एक संदर्भ है facebookexternalhit/1.1 Crawl-delay: 5
उपयोगकर्ता-एजेंट: facebookexternalhit/1.0 Crawl-delay: 5
उपयोगकर्ता-एजेंट : facebookexternalhit/* क्रॉल-विलंब: 5
लेकिन मुझे कोई विशेष संदर्भ नहीं मिल रहा है कि फेसबुक बॉट robots.txt का सम्मान करता है या नहीं। पुराने स्रोतों के अनुसार, फेसबुक "आपकी साइट को क्रॉल नहीं करता है"। लेकिन यह निश्चित रूप से झूठा है, क्योंकि मेरे सर्वर लॉग ने उन्हें मेरी साइट को एक दर्जन + आईपी से 69.171.237.0/24 और 69.171.229.115/24 की सीमा से प्रत्येक पृष्ठ पर कई पृष्ठों की दर से क्रॉल किया।
और मुझे इस पर कोई साहित्य नहीं मिल रहा है। मुझे संदेह है कि यह कुछ नया है कि एफबी ने पिछले कुछ दिनों में अभी लागू किया है, क्योंकि मेरे सर्वर ने पहले कभी दुर्घटनाग्रस्त नहीं किया था।
क्या कोई सलाह दे सकता है?
हां, कुछ हाल ही में बदल गया है क्योंकि यह 8 वर्षों में पहली बार हमें दुर्घटनाग्रस्त करना शुरू कर रहा है। माना जाता है कि वे "अपने opengraph अद्यतन कर रहे हैं"। हालांकि, हमारे पृष्ठों को देखकर यह अनुरोध कर रहा है (बहुत पुराना अस्पष्ट पृष्ठ), मुझे आश्चर्य है कि एक कानूनी बॉट जावास्क्रिप्ट को निष्पादित कर रहा है, और जैसे बटनों को खींच रहा है, एक एफबी ओपनग्राफ अपडेट ट्रिगर कर रहा है। यह सिर्फ एक झटका है ... – Stickley
संबंधित प्रश्न: http://stackoverflow.com/questions/11521798/excessive-traffic-from-facebookexternalhit-bot?lq=1 और http://stackoverflow.com/questions/7716531/ facebook- and-crawl-delay-in-robots-txt? lq = 1 – Stickley
आपके सुझावों और संदर्भों के लिए धन्यवाद, हैंक। घटना के मोड़ में, 8 नवंबर या 9वीं को कुछ घंटों के लिए, मेरी साइट प्रति सेकंड दर्जनों एक्सेसों से अभिभूत थी। लेकिन इस बार - यह फेसबुक नहीं था, लेकिन अमेज़ॅन। इसने अचानक साइट के भीतर लिंक के विशाल समूह को बड़े पैमाने पर शुरू कर दिया, लेकिन ऐसा कोई स्पष्ट पैटर्न प्रतीत नहीं होता है - कुछ पृष्ठों तक पहुंचने वाले अस्पष्ट/पुराने पृष्ठ हैं, जबकि कुछ नवीनतम हैं। आश्चर्य है कि क्या वे अपने स्वयं के खोज इंजन डेटाबेस को रीफ्रेश कर रहे हैं। – Andy