2011-01-31 9 views
5

मैं एक PHP साइट पर काम कर रहा हूं जो उपयोगकर्ताओं को साइट विषय से संबंधित अपने व्यापार के लिए एक लिस्टिंग पोस्ट करने की अनुमति देता है। इसमें एक एकल फ़ाइल यूआरएल, कुछ पाठ, और एक छवि फ़ाइल के लिए एक वैकल्पिक यूआरएल शामिल है।लोगों को मेरी वेबसाइट पर सामग्री पोस्ट करने की अनुमति देते समय सुरक्षित, गैर-वयस्क, गैर-स्पैम सामग्री के URL URL कैसे सुनिश्चित कर सकते हैं?

उदाहरण:

<img src="http://www.somesite.com" width="40" /> 
<a href="http://www.abcbusiness.com" target="new">ABC Business</a> 
<p> 
Some text about how great abc business is... 
</p> 

पाठ में HTML htmlpurifier.org से वर्ग का उपयोग कर फ़िल्टर किया जाता है और सामग्री बुरे शब्द के लिए चेक किया जाता है, तो मैं उस हिस्से के बारे में बहुत अच्छा लग रहा है।

छवि फ़ाइल यूआरएल हमेशा एक निश्चित चौड़ाई के साथ <img src="" /> टैग के अंदर रखा गया है और एक वास्तविक HTTP यूआरएल होने के लिए मान्य है, तो यह ठीक होना चाहिए।

खतरनाक हिस्सा लिंक है।

प्रश्न: कैसे मुझे यकीन है कि लिंक कुछ स्पैम, असुरक्षित, या अश्लील साइट (कोड का उपयोग कर) को इंगित नहीं करता हो सकता है?

मैं 404, आदि के लिए शीर्षलेखों की जांच कर सकता हूं ... लेकिन क्या लिंक से साइट सामग्री को सत्यापित करने का एक तेज़ और आसान तरीका है।

संपादित करें:

मैं एक कॅप्चा का उपयोग कर रहा है और पोस्टिंग की अनुमति दी है इससे पहले कि पंजीकरण की आवश्यकता होती है।

+0

है कि में प्रदर्शित करना चाहिए स्वीकृत करने के लिए उपयोग कर सकते हैं करने के लिए इस सामग्री उपयोगकर्ता

द्वारा बनाई स्थानांतरित करेंगे बना सकते हैं एक मुश्किल - मुझे नहीं लगता कि एक आसान तरीका है :( – xil3

+8

दुखद रूप से मुझे संदेह है कि "मॉडरेशन" सुनिश्चित करने का एकमात्र सुरक्षित तरीका है। –

+1

उपयोगकर्ताओं को पंजीकरण करने की आवश्यकता है, उन पर कैप्चा फेंक दें। ओह, और मध्यम। –

उत्तर

7

क्या लिंक से साइट सामग्री को सत्यापित करने का एक तेज़ और आसान तरीका है।

नहीं। यूआरएल की कोई वैश्विक सफेद/ब्लैकलिस्ट नहीं है जिसका उपयोग आप किसी भी तरह से "खराब" साइटों को फ़िल्टर करने के लिए कर सकते हैं, खासकर जब से "खराब" साइट की आपकी परिभाषा इतनी अनपेक्षित है।

भले ही आप एक यूआरएल देख सकें और बताएं कि जिस पृष्ठ पर यह इंगित करता है कि खराब सामग्री है, इन दिनों यूआरएल छिपाना आसान है।

यदि आपको वास्तव में इसे रोकने की आवश्यकता है, तो आपको अपनी सामग्री को नियंत्रित करना चाहिए। कोई भी स्वचालित समाधान अपूर्ण होने जा रहा है और आप किसी भी तरह से मैन्युअल रूप से मॉडरेट करने जा रहे हैं।

+0

"यूआरएल छिपाने में यह आसान है" मैं कहता हूं कि "यह हमेशा ..." ... "इन दिनों" के बजाय कहता है। अन्यथा +1! – Stephen

+0

@ स्टीफन मैंने विशेष रूप से यूआरएल शॉर्टिंग सेवाओं के प्रसार के कारण "इन दिनों" कहा, जो कि यूआरएल ओबफ्यूसेटर जाने के लिए मजबूती से प्रतिस्पर्धा कर रहा है। लिंक के सटीक पृष्ठ को आसानी से छिपाने के लिए बहुत सारे विकल्प कभी उपलब्ध नहीं हुए हैं। – meagar

+0

हाँ, यही मैंने सोचा था। ;) मैं बस तुच्छता पर जोर देने की कोशिश कर रहा था। एक मीठे उपकरण के लिए – Stephen

8

यह साइट URL के प्रश्न को स्क्रैप करके स्वयं को आजमाने और निर्धारित करने के लिए बहुत कठिन होगा। आप शायद कुछ तृतीय पक्ष एपीआई पर भरोसा करना चाहते हैं जो आपके लिए जांच कर सकता है। बाहर है कि एपीआई

http://code.google.com/apis/safebrowsing/

चेक, आप इसे एक यूआरएल भेज सकते हैं और यह आपको बता देंगे कि यह क्या सोचता है। यह मुख्य रूप से मैलवेयर और फ़िशिंग की जांच कर रहा है ... इतना अश्लील और स्पैम नहीं। ऐसे कुछ भी हैं जो एक ही काम करते हैं, बस Google पर चारों ओर खोजें।

+0

+1। – Stephen

2

मैन्युअल मॉडरेशन, शायद। मैं किसी अन्य प्रकार की ब्लैकलिस्ट का उपयोग करने के अलावा इसे स्वचालित करने के किसी भी तरीके से नहीं सोच सकता, लेकिन फिर भी यह हमेशा विश्वसनीय नहीं है क्योंकि नई साइटें सूची में नहीं हो सकती हैं।

इसके अतिरिक्त, आप कर्ल का उपयोग करने और इंडेक्स पेज डाउनलोड करने और कुछ ऐसे कीवर्ड की तलाश कर सकते हैं जो लाल झंडा उठाएंगे, और फिर शायद उन्हें मैन्युअल सत्यापन के लिए रखें।

मैं सुझाव देता हूं कि इन खोजशब्दों की सूची सरणी (अश्लील, लिंग, आदि) में हो।यदि आपके द्वारा कर्ल के साथ डाउनलोड किए गए इंडेक्स पेज में इनमें से कोई भी कीवर्ड है, तो मॉडरेशन के लिए अस्वीकार या ध्वजांकित करें।

यह विश्वसनीय नहीं है और न ही यह लिंक को मंजूरी देने का सबसे अनुकूलित तरीका है।

आखिरकार, आपके पास मैन्युअल मॉडरेशन होना चाहिए, लेकिन यदि आप इसे स्वचालित करना चाहते हैं, तो यह आपके लिए एक संभावित मार्ग है।

0

आप एक छोटे से निगरानी प्रणाली है कि एक स्वीकृति सूची कि केवल व्यवस्थापक सामग्री कि

साइट

संबंधित मुद्दे