2009-08-27 8 views
8

में मुझे फील्ड.Set OmitNorms (सत्य) का उपयोग करने का सुझाव दिया गया है; जब हिट की संख्या के अनुसार परिणाम को सॉर्ट करने के लिए लुसेनशर्च के लिए दस्तावेज बनाते हैं, लेकिन मुझे यह नहीं पता कि यह क्या करता है और यह सुरक्षित है।Field.Set OmitNorms (सत्य) का उपयोग क्या है; ल्यूसीन

हिट की संख्या के अनुसार परिणाम क्रमबद्ध करने का अर्थ है कि जिस दस्तावेज़ में खोज टेक्स्ट पाया जाता है, वह शीर्ष पर आना चाहिए, जिसके बाद खोज टेक्स्ट के लिए कम संख्या में मिलान होता है।

मुझे इसकी मूर्खता पता है लेकिन मैं इसे लागू करने से पहले जानना चाहता हूं कृपया मदद करें।

उत्तर

10

ऑप्टिमाइज़ेशन की अवधि में क्या मानदंड मानदंडों का विवरण this article for a good paragraph देखें। मूल रूप से इस तरह के क्षेत्र के अंदर की शर्तों के लिए मिनी ल्यूसीन इंडेक्स होने की तरह, इसलिए यह वास्तव में उन क्षेत्रों के लिए उपयोगी है जिनमें उनके अंदर बहुत अधिक टेक्स्ट होगा।

+4

दस्तावेज़ को स्थानांतरित कर दिया गया है लेकिन http://web.archive.org/web/20101111232408/http://www.lucidimagination.com/Community/Hear-from-the-Experts पर इंटरनेट संग्रह में पाया जा सकता है/लेख/स्केलिंग-Lucene और Solr –

5

डिफ़ॉल्ट रूप से, एक फ़ील्ड को norm, दस्तावेज़ के बूस्ट का एक उत्पाद, फ़ील्ड का बढ़ावा, और फ़ील्ड की लंबाई सामान्यीकरण कारक (Similarity scoring देखें) के साथ अनुक्रमित किया गया है। यह प्रत्येक फ़ील्ड की स्टोरेज और मेमोरी खपत के लिए एक बाइट जोड़ता है, जिसे omitNorms का उपयोग करके चयनित फ़ील्ड या फील्ड प्रकारों के लिए ओमेट किया जा सकता है।

बूस्ट इंडेक्सिंग के दौरान निर्दिष्ट किए जाते हैं, जबकि lengthNorm की गणना की जाती है ताकि यदि दो दस्तावेज़ एक क्वेरी शब्द f बार से मेल खाते हैं, तो लंबा दस्तावेज़ कम स्कोर प्राप्त करेगा।

तो यदि आप दस्तावेजों की लंबाई के अनुपात में शर्तों की संख्या के मुकाबले मिलान किए गए शब्दों की सटीक संख्या के आधार पर अपने दस्तावेज़ों को स्कोर करना चाहते हैं, तो omitNorms का उपयोग करें (और स्मृति खपत लाभ मुक्त करें)।

संबंधित मुद्दे