2009-10-23 17 views
9

बिंग की खोज हिट काफी प्रभावशाली हैं, क्या माइक्रोसॉफ्ट ने अपनी खोज तकनीक के दृश्यों के पीछे किसी को भी नहीं जाने दिया है? http://www.discoverbing.com का प्रयास किया लेकिन मेरे प्रश्न का उत्तर नहीं मिला।बिंग के पीछे तकनीक क्या है? मानचित्र का अपना संस्करण-एल्गोरिदम कम या कुछ और?

उत्तर

8

माइक्रोसॉफ्ट ने ऐतिहासिक रूप से अपने रैंकिंग समारोह के रूप में एक तंत्रिका नेटवर्क रैंकिंग फ़ंक्शन का उपयोग किया है। तंत्रिका नेटवर्क उन सैकड़ों चर को जोड़ता है जो यूआरएल रैंकिंग से संबंधित इसके साथ जुड़े होंगे। Paper वे आमतौर पर विस्तृत रैंकर का उपयोग करके 100 से अधिक दस्तावेज़ों को स्कोर करेंगे। प्रत्येक क्वेरी नोड को अलगाव में अपने शीर्ष दस्तावेज़ों को स्कोर करने और उन्हें एग्रीगेटर पर वापस करने की आवश्यकता होगी। रैंकिंग वास्तव में बहुत जटिल है और स्कोरिंग एल्गोरिदम आम तौर पर बहुस्तरीय होते हैं।

गणना नौकरियों, कारक उत्पादन आदि के लिए ... माइक्रोसॉफ्ट सर्च SCOPE का उपयोग करता है जो मुझे लगता है कि Dryad के शीर्ष पर बनाया गया है लेकिन यह ड्राइडलाइन का उपयोग नहीं करता है। स्कोप मूल रूप से क्लस्टर के शीर्ष पर एक SQL भाषा है।

वास्तव में माइक्रोसॉफ्ट Google की तुलना में खोज में अपनी तकनीक के बारे में कहीं अधिक खुला है। Microsoft Research Asia और Microsoft Research Silicon Valley

0

दूसरी हाथ की जानकारी है, लेकिन मुझे लगता है कि वे शीर्ष 100 या तो परिणाम खोजने के लिए उलटा इंडेक्स (इंडेक्स?) का उपयोग करते हैं, और फिर वे शीर्ष 10 में कई बार इसे कम करने के लिए तंत्रिका नेटवर्क के एक सेट का उपयोग करते हैं , शीर्ष 3, और फिर पहले को खोजने के लिए।

वे ऐसा इसलिए करते हैं क्योंकि वे पहली हिट का कारण बनते हैं जो खोज इंजन काम करता है या नहीं। यदि आप सीएनएन की खोज करते हैं और आपको पहली हिट के रूप में CNN.com नहीं मिलता है, तो उपयोगकर्ता सोचते हैं कि इंजन काम नहीं करता है।

फिर, यह दूसरा हाथ ज्ञान है। मैंने इसे एक ऐसे दोस्त से सुना जो एमएस में थोड़ी देर के लिए अपनी खोज टीम पर काम करता था।

+0

और नक्शा कम करना वास्तव में 'खोज' एल्गोरिदम का हिस्सा नहीं है। यह समानांतर भागों में एक समस्या को तोड़ने का एक तरीका है। कह रही है कि, वे शायद कुछ इसी तरह का उपयोग करें। –

+0

सहमत है कि यह एल्गोरिदम नहीं है जो खोज करता है लेकिन Google के दस्तावेज़ों को पढ़ता है, पेज रैंक (परिणामों की Google गुणवत्ता की रीढ़ की हड्डी) इस एल्गोरिदम का उपयोग करता है, इस प्रकार यह खोज से संबंधित है। –

संबंधित मुद्दे