2012-04-10 13 views
8

को स्क्रैप करने में सक्षम नहीं है मेरे पास नीचे दिए गए अनुसार मेरे पृष्ठ के लिए HTML संरचना है। मैंने सभी मेटा और टैग जोड़े हैं, लेकिन फिर भी फेसबुक मेरी साइट से किसी भी जानकारी को स्क्रैप करने में सक्षम नहीं है।फेसबुक मेरे यूआरएल

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:fb="http://www.facebook.com/2008/fbml"> 
    <head> 
      <meta http-equiv="Content-Type" content="text/html;" charset=utf-8"></meta> 
      <title>My Site</title> 
      <meta content="This is my title" property="og:title"> 
      <meta content="This is my description" property="og:description"> 
      <meta content="http://ia.media-imdb.com/images/rock.jpg" property="og:image"> 
      <meta content="<MYPAGEID>" property="fb:page_id"> 
      ....... 
    </head> 
    <body> 
    ..... 

जब मैं इनपुट फेसबुक डीबगर में यूआरएल (https://developers.facebook.com/tools/debug), मैं निम्न संदेश मिलता है:

Scrape Information 
Response Code 404 

Critical Errors That Must Be Fixed 
Bad Response Code URL returned a bad HTTP response code. 


Errors that must be fixed 

Missing Required Property The 'og:url' property is required, but not present. 
Missing Required Property The 'og:type' property is required, but not present. 
Missing Required Property The 'og:title' property is required, but not present. 


Open Graph Warnings That Should Be Fixed 
Inferred Property The 'og:url' property should be explicitly provided, even if a value can be inferred from other tags. 
Inferred Property The 'og:title' property should be explicitly provided, even if a value can be inferred from other tags. 

फेसबुक क्यों नहीं पढ़ रहा है मेटा टैग जानकारी? पेज पहुँचा जा सकता है और प्रवेश के पीछे छिपा हुआ नहीं आदि

अद्यतन

ठीक है मैं डीबगिंग के सा था और इस मैं क्या पाया है। मेरे पास मेरी निर्देशिका में htaccess नियम सेट है- मैं PHP कोडिनेटर फ्रेमवर्क का उपयोग कर रहा हूं और url से index.php को निकालने के लिए htaccess नियम है।

तो, जब मैं index.php के बिना फेसबुक डीबगर (https://developers.facebook.com/tools/debug) पर यूआरएल खिलाता हूं, तो फेसबुक 404 दिखाता है, लेकिन जब मैं index.php के साथ url फ़ीड करता हूं, तो यह मेरे पेज को पार्स करने में सक्षम है।

अब यूआरएल में index.php नहीं होने पर मैं फेसबुक स्क्रैप सामग्री कैसे बना सकता हूं?

यह अपने htaccess नियम है:

<IfModule mod_rewrite.c> 
    RewriteEngine On 
    RewriteBase/

    #Removes access to the system folder by users. 
    #Additionally this will allow you to create a System.php controller, 
    #previously this would not have been possible. 
    #'system' can be replaced if you have renamed your system folder. 
    RewriteCond %{REQUEST_URI} ^system.* 
    RewriteRule ^(.*)$ /index.php?/$1 [L] 

    #When your application folder isn't in the system folder 
    #This snippet prevents user access to the application folder 
    #Submitted by: Fabdrol 
    #Rename 'application' to your applications folder name. 
    RewriteCond %{REQUEST_URI} ^application.* 
    RewriteRule ^(.*)$ /index.php?/$1 [L] 

    #Checks to see if the user is attempting to access a valid file, 
    #such as an image or css document, if this isn't true it sends the 
    #request to index.php 
    RewriteCond %{REQUEST_FILENAME} !-f 
    RewriteCond %{REQUEST_FILENAME} !-d 
    RewriteRule ^(.*)$ index.php?/$1 [L] 
</IfModule> 

<IfModule !mod_rewrite.c> 
    # If we don't have mod_rewrite installed, all 404's 
    # can be sent to index.php, and everything works as normal. 
    # Submitted by: ElliotHaughin 

    ErrorDocument 404 /index.php 
</IfModule> 
+0

यह 404 (नहीं मिला) त्रुटि कोड की रिपोर्ट कर रहा है। ** ** आपको उस यूआरएल के साथ कुछ गलत होना चाहिए जिसे आप खिला रहे हैं। –

+0

हाय क्लाउस, मैंने अपने प्रश्न को कुछ डीबगिंग के साथ अपडेट किया है। कृपया एक नज़र डालें और मुझे अपनी टिप्पणियां – Ninja

उत्तर

8

फेसबुक प्रलेखन ओपन ग्राफ प्रोटोकॉल पर विवरण और कैसे इतना है कि फेसबुक सही रूप में आपके यूआरएल खुरच कर सकते हैं सही मेटा टैग शामिल करने के लिए भी शामिल है।

https://developers.facebook.com/docs/opengraphprotocol/

अनिवार्य रूप से आप क्या करना चाहेंगे कि आपके मौजूदा मेटा टैग के लिए कुछ विशेष og:tags शामिल बजाय (या अतिरिक्त) है।

<head> 
    <title>Ninja Site</title> 
    <meta property="og:title" content="The Ninja"/> 
    <meta property="og:type" content="movie"/> 
    <meta property="og:url" content="http://www.nin.ja"/> 
    <meta property="og:image" content="http://nin.ja/ninja.jpg"/> 
    <meta property="og:site_name" content="Ninja"/> 
    <meta property="fb:admins" content="USER_ID"/> 
    <meta property="og:description" 
      content="Superhuman or supernatural powers were often 
        associated with the ninja. Some legends include 
        flight, invisibility and shapeshifting..."/> 
    ... 
    </head> 

आप एक .htaccess फ़ाइल बातें पुनः निर्देशित और यह मुश्किल है कि आप अपने .htaccess के साथ फेसबुक के क्रॉलर का पता लगाने और यह सही टैग खिला के साथ भाग प्राप्त करने में सक्षम हो सकता है फेसबुक अपने URL स्क्रैप करने के लिए कर रही है। मेरा मानना ​​है कि उपयोगकर्ता एजेंट है कि फेसबुक क्रॉलर प्रदान करता है यह है:

facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php) 

प्रलेखन भी एक वर्ग making sure that their crawlers can access your site के बारे में बात की है।

अपनी कॉन्फ़िगरेशन के आधार पर आप अपने सर्वर access_log को देखकर इसका परीक्षण कर सकते हैं। एक यूनिक्स सिस्टम पर अपाचे चल रहा है, एक्सेस लॉग /var/log/httpd/access_log पर स्थित है।

तो आप अपने .htaccess फ़ाइल में इस के समान एक प्रवेश इस्तेमाल कर सकते हैं -

RewriteCond %{HTTP_USER_AGENT} ^facebookexternalhit 
RewriteRule ^(.*)$ ogtags.php?$1 [L,QSA] 

[L,QSA] झंडे कि मैं रखा वहाँ राज्य है कि इस एल ast नियम यह है कि वर्तमान पर लागू की जाएगी है अनुरोध (L) और QSA (क्वेरी स्ट्रिंग एपेंड) बताता है कि यूआरएल फिर से लिखा जाने पर दिया गया कोई भी क्वेरी स्ट्रिंग पास कर दिया जाएगा।उदाहरण के लिए, एक यूआरएल जैसे: - ogtags.php?id=foo&action=bar

https://example.com/?id=foo&action=bar 

इस तरह ogtags.php को दे दिया जाएगा। आपके ogtags.php फ़ाइल को गतिशील ओजी उत्पन्न करने के लिए दिया जाएगा: मेटा टैग पारित पैरामीटर के अनुसार।

अब जब भी आपकी .htaccess फ़ाइल फेसबुक उपयोगकर्ता एजेंट का पता लगाती है, तो वह उसे ogtags.php फ़ाइल (जिसमें सही ओजी: मेटा जानकारी हो सकती है) पास कर देगी। कृपया अपने .htaccess में किसी भी अन्य नियमों से अवगत रहें और वे नए नियमों को कैसे प्रभावित कर सकते हैं।

.htaccess प्रविष्टियों से जो आपने विस्तृत किया है, मैं इस नए "फेसबुक नियम" को पहले नियम के रूप में रखने की सलाह दूंगा।

+0

हाय लिक्स, अपडेट के लिए बहुत बहुत धन्यवाद। मेरे पास एक मुद्दा है- फिर भी लिखने के नियम में, आपने उल्लेख किया है कि मैं ogtags.html लोड करता हूं लेकिन मेटा टैग में पृष्ठ के आधार पर गतिशील सामग्री होगी। मैं वहां एक स्थिर एचटीएमएल पेज नहीं दे सकता। मैंने ogtags.html को इस नियम के साथ बदलने की कोशिश की: रिवाइट्रूल^(। *) $ Index.php?/$ 1 [एल] लेकिन मदद नहीं की। इसे कैसे प्राप्त किया जाए इस पर कोई विचार? – Ninja

+0

@Lix: क्या आपको कोई विचार है कि जब मैं आपके दो नियमों का उपयोग करता हूं तो मुझे फेसबुक डीबगर टूल से 500 त्रुटि क्यों मिलती है? अग्रिम धन्यवाद ... – sergio

+0

अरे वहाँ @ser - क्या आपने फेसबुक से अनुरोधों के लिए अपने सर्वर लॉग की जांच की है जिन्हें अस्वीकार कर दिया जा रहा है? मैंने अभी भी [इस लिंक] को जोड़ा है (https://developers.facebook.com/docs/opengraph/howtos/maximizing-distribution-media-content/#crawl) यहां मेरे उत्तर में, यह आपके लिए भी उपयोगी हो सकता है। – Lix

1

मुझे एक ही समस्या थी, जो था: खराब प्रतिक्रिया कोड: URL ने एक खराब HTTP प्रतिक्रिया कोड लौटा दिया।

लेकिन अजीब तरह से इस यह क्या हल है: मैं अपनी साइट HEAD टैग करने के लिए

<meta property="og:locale" content="en_US" /> 

जोड़ दिया है और यह काम किया।

इसके अलावा, अपने एप्लिकेशन डैशबोर्ड (जहां आपको अपना एपीपी आईडी मिलती है) में भूलना नहीं है, आपके पास कम से कम "फेसबुक लॉगिन के साथ वेबसाइट" सक्षम होना चाहिए और वेबसाइट का यूआरएल दर्ज करना चाहिए। अन्यथा यह काम नहीं करेगा ... भले ही आप अपनी साइट पर किसी भी फेसबुक लॉग इन का उपयोग नहीं कर रहे हों।

संबंधित मुद्दे