2010-08-10 10 views
5

कई महीनों के बाद साइट हर प्रमुख खोज इंजन में खोज परिणामों से गायब हो गई, मुझे अंत में एक संभावित कारण पता चला।HEAD अनुरोध "2003" प्राप्त करते समय "403 वर्जित" प्राप्त करता है?

मैंने सर्वर हेडर की जांच करने के लिए वेबबग का उपयोग किया। अगर अनुरोध हेड है या प्राप्त करें तो अंतर देखें।

प्रमुख भेजा डेटा:

HEAD/HTTP/1.1 
Host: www.attu.it 
Connection: close 
Accept: */* 
User-Agent: WebBug/5.0 

HEAD प्राप्त डेटा:

HTTP/1.1 403 Forbidden 
Date: Tue, 10 Aug 2010 23:01:00 GMT 
Server: Apache/2.2 
Connection: close 
Content-Type: text/html; charset=iso-8859-1 

भेजा डेटा:

GET/HTTP/1.1 
Host: www.attu.it 
Connection: close 
Accept: */* 
User-Agent: WebBug/5.0 

प्राप्त डेटा प्राप्त करें: GET अनुरोध भेज

HTTP/1.1 200 OK 
Date: Tue, 10 Aug 2010 23:06:15 GMT 
Server: Apache/2.2 
Last-Modified: Fri, 08 Jan 2010 08:58:01 GMT 
ETag: "671f91b-2d2-47ca362815840" 
Accept-Ranges: bytes 
Content-Length: 722 
Connection: close 
Content-Type: text/html 

// HTML code here 

अब, डिफ़ॉल्ट रूप से ब्राउज़र (कम से कम यह है कि क्या फ़ायरबग कहते है)। क्या यह संभव है कि क्रॉलर इसके बजाय एक हेड अनुरोध भेजें? यदि हां, तो यह सर्वर केवल 403 के साथ क्यों प्रतिक्रिया करता है, जबकि अन्य साइटों के अन्य सर्वर मैं नहीं कर रहा हूं?

मामले में यह महत्वपूर्ण है, .htaccess में केवल लाइन मौजूद है (जब तक कि मेरे मुवक्किल, इसे बदल के रूप में वे मुझे अपने सर्वर तक पहुँच देने के लिए नहीं करना चाहते हैं)

AddType text/x-component .htc 

अद्यतन
धन्यवाद @ रिक्क। फायरबग और फिडलर दोनों जीईटी अनुरोध भेजते हैं, जो 200 (या 300) प्रतिक्रियाएं प्राप्त करते हैं। जैसा सोचा था। तो मुझे लगता है कि यह या तो सर्वर खराब सेटिंग है (भले ही यह अजीब है क्योंकि होस्टिंग लाखों ग्राहकों के साथ एक प्रमुख कंपनी से है) या जो कुछ उन्होंने .htaccess में रखा है। उन्हें मुझे अपने खाते में देखने देना होगा।

मेरे प्रश्न का दूसरा भाग यह था कि यदि वेबसाइट किसी भी खोज इंजन (साइट: www.attu.it में कोई परिणाम नहीं देती है) में दिखाई देने वाली वेबसाइट का कारण हो सकता है। कोई सोच?

अद्यतन 2
कुछ लगभग नगण्य के बाद, यह पता चला है वहाँ था phpMyAdmin रोबोट-अवरुद्ध रूट निर्देशिका, कि रोबोट से किसी भी अनुरोध के कारण होता में .htaccess एक 403

+0

यह सर्वर के साथ एक बग है, ग्राहक इसे तय करना चाहते हैं, उन्हें आपको कम से कम कुछ पहुंच देना चाहिए। कम से कम, उनसे पूछें कि क्या वे वर्तमान। Htaccess की एक प्रति देख सकते हैं। –

उत्तर

1

निषिद्ध के साथ वापस भेजे जाने के लिए मैं फिडलर स्थापित करने और अनुरोध पर ध्यान से देखकर सुझाव दूंगा। मैंने कभी-कभी देखा है कि उस पृष्ठ पर एक आइकन जो उस फ़ोल्डर में है जिसके लिए प्रमाणीकरण की आवश्यकता होती है, उसे 403 लौटाया जाता है।

फिडलर आपको एक अच्छा विचार देगा, और आप फायरबग ऐड-ऑन भी इंस्टॉल कर सकते हैं और त्रुटियों के लिए पृष्ठ का निरीक्षण कर सकते हैं।

साइट पर देखकर मुझे favicon.ico के लिए 404 का गुच्छा मिलता है, लेकिन इसके अलावा जब मैं एक साधारण जीईटी अनुरोध करता हूं तो मुझे 200 ओके मिलते हैं, लेकिन जब मैं सिर करता हूं, तो मुझे 403 भी मिलता है। अब इसमें देख रहे हैं।

अद्यतन: मुझे लगता है कि यह अपाचे सर्वर पर एक विन्यास हो सकता है, लेकिन 100% सुनिश्चित नहीं है।http://hc.apache.org/httpclient-3.x/methods/head.html

UPDATE2: यह http://www.pubbs.net/200811/httpd/17210-usershttpd-how-to-reject-head-request.html पढ़ना मुझे विश्वास दिलाता है कि आपका अपाचे सर्वर HEAD अनुरोधों को अस्वीकार करने के लिए सेट किया जा सकता है। उस मामले में यह एक 403

+0

@mjsarfatti - मुझे यकीन नहीं है, लेकिन अगर क्रॉलर/रोबोट साइट को क्रॉल करने के लिए HEAD अनुरोध का उपयोग करते हैं, तो हाँ, आपको कोई समस्या होगी। – Ryk

+0

मुझे फिडलर –

1

कुछ व्यवस्थापक httpd.conf

< सीमा डाल कॉपी उन्हें हटा में लिखते हैं>
आदेश से इनकार वापस आ जाएगी,
सभी
से इंकार 10.0
से अनुमति दें अनुमति देते हैं </सीमा>

< LimitExcept डाल कॉपी उन्हें हटा>
आदेश इनकार करते हैं, की अनुमति देने के
से इंकार सभी
</LimitExcept>

यह एक HEAD अनुरोध "निषिद्ध" का उत्पादन। आपको यह जांचना चाहिए।

1

मुझे यह सही समस्या थी क्योंकि मैं हस्ताक्षरित यूआरएल का उपयोग कर रहा था।

प्रत्येक हस्ताक्षरित यूआरएल केवल एक विधि (जैसे जीईटी, या हेड) के लिए अच्छा है। यदि आप एकाधिक विधियों का उपयोग करना चाहते हैं, तो आपको एकाधिक यूआरएल रखना होगा।

+0

से कर्ल आसान लगता है मुझे लगता है कि यह समस्या है जो मैं वर्तमान में अपने ग्रैडल बिल्ड के साथ प्राप्त कर रहा हूं: https://stackoverflow.com/questions/48253755/gradle-failing-to-download- निर्भरता- when-head-request -fails। क्या आपको पता है कि उसके आसपास कैसे काम करना है? –

संबंधित मुद्दे