2009-03-23 17 views
7

द्वारा संबंधित विषयों के लिए डेटास्टोर खोजना उदाहरण के लिए, स्टैक ओवरव्लो अन्य प्रश्नों का निर्धारण कैसे करता है?कीवर्ड

जब मैंने ऊपर दिए गए प्रश्न में टाइप किया और फिर इस ज्ञापन नियंत्रण में टैब्ड किया तो मैंने मौजूदा प्रश्नों की एक सूची देखी जो कि मैं पूछ रहा हूं जैसा ही हो सकता है।

समान प्रश्न खोजने के लिए किस तकनीक का उपयोग किया जाता है?

+0

यह एक बुरी तरह से स्वरूपित प्रश्न है, लेकिन एक प्रयोक्ता प्रश्न नहीं है। उपयोगकर्ता एल्गोरिदम के बारे में पूछ रहा है जो प्रोग्रामिंग से संबंधित है। – DevinB

+0

यह उपयोगकर्ता की आवाज नहीं है। मैं एक एल्गोरिदम के बारे में प्रोग्रामिंग से संबंधित प्रश्न पूछ रहा हूं क्योंकि मुझे WinForms एप्लिकेशन में कुछ ऐसा करने की आवश्यकता है। कुछ लोग, उन्हें थोड़ी सी शक्ति दें और वे पागल हो जाएं! –

+0

[स्टैक ओवरफ्लो के संबंधित प्रश्न] के संभावित डुप्लिकेट (http://stackoverflow.com/questions/393505/stackoverflows-related-questions) –

उत्तर

3

मैं मार्च 20 [email protected] से एक ईमेल मिला कहा गया है कि यह कैसे काम करता है:

"एक सवाल पूछ" खोज शीर्षक पर विशेष है और होगा शरीर में नहीं मैच कुछ भी । यह मेरे लिए रहस्य है क्यों लोग सोचते हैं कि यह बेहतर है।

अंतिम वाक्य खोज बार को संदर्भित करता है, जो मैंने पाया है, जब मैं एक विशिष्ट प्रश्न ढूंढने की कोशिश कर रहा हूं तो मुझे कम उपयोगी लगता है।

1

मुझे लगता है कि यह सादा पुराना शब्द मिलान है। हालांकि, मैं यह जोड़ सकता हूं कि यह सुविधा काम नहीं करती है और साथ ही मैं इसे भी पसंद करूंगा। साइट के साथ Google खोज करना बेहतर है: प्रासंगिक सुझाव प्रदान करने के लिए SO पर भरोसा करने के बजाय stackoverflow.com उपसर्ग।

1

मिलान कार्यक्रम सभी प्रश्नों का एक सूचकांक संग्रहीत करेगा। जब आप कोई प्रश्न पूछते हैं, तो आपके प्रश्न के सभी कीवर्ड इंडेक्स के खिलाफ मेल खाते हैं। यह Google खोज के समान है। Lucene ओपन सोर्स सर्च इस के लिए उपयोग की जा सकती है (और उच्च संभावना के साथ)। चूंकि परिणाम काफी सटीक नहीं हैं, इसलिए मुझे अनुमान है कि वे केवल अनुमानों के रूप में प्रश्नों की शीर्षकों को इंडेक्स करते हैं।

अन्य संबंधित कीवर्ड collaborative filtering है, अमेज़ॅन द्वारा लोकप्रिय एल्गोरिदम अन्य समान ग्राहकों के व्यवहार के आधार पर उत्पादों की सिफारिश करने के लिए लोकप्रिय है। वर्तमान स्थिति में, सहयोगी फ़िल्टरिंग के आधार पर एक वैकल्पिक एल्गोरिदम है: कीवर्ड से प्रश्न निकाले जाते हैं, फिर कीवर्ड के साथ जुड़े (इतिहास में) टैग पाए जाते हैं। जिन प्रश्नों को वे टैग लौटाए गए हैं। खैर, यह देखने के लिए प्रयोगों की आवश्यकता है कि यह बिल्कुल अच्छा काम करता है या नहीं।

1

खराब - एमएस एसक्यूएल पूर्ण पाठ खोज का उपयोग करके, मेरा मानना ​​है। लुसीन, आईएमओ का उपयोग करके आपको बेहतर भाग्य मिलेगा। विषय पर अधिक पृष्ठभूमि के लिए विकिपीडिया लेख Lucene पर देखें या information retrieval का सामान्य विषय देखें।

संबंधित मुद्दे