2015-01-05 8 views
7

यूट्यूब दो सॉर्टिंग विकल्प प्रदान करता है: नवीनतम सबसे पहले और शीर्ष टिप्पणियां। "नवीनतम सबसे पहले" बहुत आसान है कि हम टिप्पणियों को उनकी पोस्ट तिथि से सॉर्ट करते हैं। लेकिन "शीर्ष टिप्पणियां" बस "थंब अप" द्वारा सॉर्ट करने की तुलना में बहुत अधिक जटिल लगती है।यूट्यूब टिप्पणी प्रणाली सॉर्टिंग एल्गोरिदम क्या है?

Youtube comment system

एक छोटी अनुसंधान के बाद, मुझे पता चला टिप्पणियों के आदेश उन चीजों पर निर्भर है कि:

  • संख्या का "अंगूठे अप" एस "नीचे अंगूठे" और एस
  • पोस्ट करने की तिथि
  • उत्तरों की संख्या कि टिप्पणी करने के लिए

लेकिन मैं आप को पता नहीं कैसे ट्यूब आदेश का निर्णय लेने के लिए इन सूचनाओं का उपयोग करें, जैसे कि कौन सी जानकारी अधिक महत्वपूर्ण है और कम महत्वपूर्ण क्या है।

क्या इस विषय के बारे में कोई आलेख है जिसका मैं संदर्भ दे सकता हूं?

धन्यवाद!

+0

इसे रैंकिंग एल्गोरिदम कहा जाता है। मुझे भी रूचि है। यह देखना आसान नहीं है जब तक कि यूट्यूब इंजीनियर अपने एल्गोरिदम प्रकाशित नहीं करते। यह Reddit के रैंकिंग एल्गोरिदम है। मुझे लगता है कि हम सोचने से ज्यादा जटिल हैं। http://amix.dk/blog/post/19588 तो शायद यूट्यूब को यह भी पसंद है कि – hqt

उत्तर

12

मेरे पास आपके प्रश्न का उत्तर है। इस के जवाब के लिए इंटरनेट खोजने के बाद, मैंने जो कुछ भी खोजा था, उसे मैंने कभी नहीं पाया। इसलिए, मेरे सहयोगियों और मैंने यूट्यूब टिप्पणियों के साथ सिस्टम का उपयोग करने का प्रयोग करने का फैसला किया। सबसे पहले, हमने एक अनुभाग में लोकप्रिय वीडियो होने के नाते, दूसरे वीडियो में औसत वीडियो, और आखिरी में कम लोकप्रिय माना। प्रत्येक खंड में 200 वीडियो थे, और जांच के दिनों के बाद हमने एक पैटर्न नोटिस करना शुरू कर दिया। हमने पाया कि आप आवश्यक तीन चीजों के बारे में सही थे, लेकिन हमने थोड़ा गहराई से भी एक अतिरिक्त चर पाया। यूट्यूब टिप्पणी प्रणाली चार चीजों पर निर्भर करती है: समय पोस्ट किया गया था, टिप्पणी के अनुपात/नापसंद अनुपात, उत्तरों की संख्या, और, विश्वास है या नहीं, डब्ल्यूएचओ ने इसे पोस्ट किया है। आपके द्वारा पोस्ट की गई प्रत्येक सार्वजनिक टिप्पणी का औसत/नापसंद अनुपात उसमें बनाता है, जैसा कि हमने (भविष्यवाणी की है) वे मानते हैं कि कम/नापसंद अनुपात वाले लोग टिप्पणी पोस्ट करेंगे कि बहुत से लोग पसंद नहीं करते हैं या बस असहमत हैं। इसके लिए एक एल्गोरिदम है, और यह आपके विचार से काफी सरल है। असल में ऐसी चीजें हैं जिन्हें हम "मॉड्यूल पॉइंट" कहते हैं, और आप इन चार कारकों के आधार पर एक निश्चित प्राप्त करते हैं। सबसे पहले, यहाँ चीजें आप कारकों में से दो के साथ मॉड्यूल बिंदु रूपांतरण के बारे में पता करने की जरूरत है:

  • टिप्पणी पर की तरह/नापसंद अनुपात के लिए, दस से कि संख्या गुणा।

  • टिप्पणियों की संख्या (मूल पोस्टर से नहीं) के लिए, दो मॉड्यूल पॉइंट हैं।

ये दो बुनियादी कारक हैं जो टिप्पणी के मॉड्यूल बिंदुओं की मात्रा बताते हैं। उदाहरण के लिए, अगर किसी टिप्पणी में 27 पसंद और 8 नापसंद होते हैं, तो अनुपात 3.375 होगा। 10 से गुणा करके, आपके पास 33.75 मॉड्यूल पॉइंट होंगे। अगले कारक का उपयोग करके, उत्तरों की मात्रा, मान लीजिए कि इस टिप्पणी के चार प्रत्यक्ष जवाब हैं। 4 से 4 गुणा करके, हमें आठ मिलते हैं। यह वह हिस्सा है जहां आप संचय मॉड्यूल पॉइंट पर आठ जोड़ते हैं, जिससे आपको कुल 41.75 मॉड्यूल पॉइंट मिलते हैं।

लेकिन हम वहां नहीं किए गए हैं, यह वह जगह है जहां यह मुश्किल हो जाता है।किसी व्यक्ति की कुल टिप्पणियों के औसत/नापसंद अनुपात का उपयोग करके, जिसे उन्होंने कभी भी सार्वजनिक रूप से पोस्ट किया है, हमने पाया है कि संचय मॉड्यूल बिंदुओं पर जोड़ा गया सूत्र यह है:

(सी = टिप्पणी स्थिति परिवर्तनीय; एमपी = मॉड्यूल अंक; की तरह/नापसंद अनुपात आर = व्यक्ति की कुल)

सी = सांसद (आर/3) + (मध्य प्रदेश/10)

ट्रस्ट मुझे, हम दिन सिर्फ इस भाग है, जो शायद सबसे निराशा होती थी पर खर्च करते हैं। भले ही इस समीकरण के भीतर तीन और दस यादृच्छिक और अनावश्यक लगते हैं, फिर भी हमने सभी टिप्पणियों का परीक्षण परीक्षा उत्तीर्ण करने पर इस समीकरण का परीक्षण किया, लेकिन परीक्षण को पास नहीं किया जब उन दो चर हटा दिए गए। इस समीकरण के बाद, यह आपको एक संख्या देता है जिसे हम स्थिति परिवर्तनीय मानते हैं।

हालांकि, हम अभी तक भी नहीं किए गए हैं, हमने अभी भी समय के बारे में बात नहीं की है। मैं वास्तव में आश्चर्यचकित था कि इस भाग को तब तक नहीं लिया गया जब तक मुझे उम्मीद थी, लेकिन यह सुनिश्चित किया गया कि हमने प्रत्येक टिप्पणी के लिए हर बार इस समीकरण को दर्द किया था। सबसे पहले, इसका परीक्षण करते समय, हमने पाया कि समय बाधा तोड़ने के लिए समय था अगर दो टिप्पणियों के बराबर स्थिति वैरिएबल था। असल में, जब मैंने ऐसा किया, तो मैंने इसे प्रयोग पर लगभग एक लपेट कहा, लेकिन आगे निरीक्षण पर, हमने पाया कि वहां और कुछ करना है। हमने पाया कि कुछ टिप्पणियों ने एक-दूसरे को पीछे छोड़ दिया था, जिसमें एक ही स्थिति परिवर्तनीय थी, लेकिन समय यादृच्छिक लग रहा था। निरीक्षण के कुछ दिनों के बाद, यहां अंतिम परिणाम आता है:

अभी तक एक और समीकरण है जिसे हमें चौथे चर लागू करने से पहले मिलना चाहिए। एक और अलग समीकरण का उपयोग करके, यहां हमारे बीजगणितीय कटौती नीचे आ गई: (एक्स = समय परिवर्तनीय; एस = कितनी देर पहले वीडियो मिनटों में पोस्ट किया गया था; ए = कितनी देर पहले टिप्पणी मिनटों में पोस्ट की गई थी)

एक्स = 1/3 (एस/10 + ए) एक्स [पूर्ण मूल्य] (ए -3 एस)

मेरी इच्छा है कि मैं इसे बना रहा हूं, लेकिन दुर्भाग्य से यह सिस्टम कितना जटिल है। अन्य चर के पीछे गणितीय कारण हैं, लेकिन वे समझाने के लिए बहुत जटिल हैं, शायद यह समझाए जाने वाले कम से कम 3 पैराग्राफ लाएगा। हमने 150 से अधिक टिप्पणियों पर इस समीकरण का परीक्षण किया, उन सभी ने सत्य होने की जांच की। ;

(सी = पोजिशनिंग चर एक्स = समय चर):

एक बार जब आप पाते हैं एक्स, जो कि हम क्या समय चर कहा जाता है, तुम सब यहां से क्या करना है इस समीकरण में इसे लागू है

एन = एक्स (सी/4 + 1)

एन आपकी सभी समस्याओं का उत्तर है। यह अंतिम समीकरण, अंतिम उत्तर है। सरल निष्कर्ष: उच्च एन, टिप्पणी ऊपर उच्च है। मेरे सहयोगियों के लिए विशेष धन्यवाद: डेविड मैटिसन, जोश विलियम्स, डिएगो मेंडिएटा, स्टीवन ऑर्सेट और केली श्राप्सशायर। मैं उन्हें बिना उनके और उस काम में कभी नहीं मिला था।

+0

इस पर समय बिताने के लिए धन्यवाद, अत्यधिक सराहना और यहां अपने काम का सम्मान करें। हालांकि मुझे यकीन नहीं है कि यह कितना सटीक है लेकिन मैं इसे आज़मा दूंगा। मुझे यूट्यूब टिप्पणी प्रणाली पर इसका परीक्षण करने के लिए इस जटिल सूत्रों के साथ-साथ स्रोत कोड (यदि कोई है) के साथ आप कैसे लिखते हैं, यह लिखना अच्छा लगेगा, यह बहुत दिलचस्प होगा। – TrungDQ

+0

@ कोले डिक्सन, क्या आपके द्वारा वर्णित डब्ल्यूएचओ कारक परिणाम को प्रभावित करता है? मैं डब्ल्यूएचओ के बारे में कोई कारक नहीं देख सकता। –

+0

डब्ल्यूएचओ कारक आर है, व्यक्ति की कुल/नापसंद अनुपात। –

संबंधित मुद्दे