2010-04-08 17 views
5

में फ़ील्ड को ढहने का सर्वोत्तम अभ्यास मुझे डुप्लिकेट (आईडी के साथ एक स्ट्रिंग फ़ील्ड के संदर्भ में परिभाषित) को संकुचित करने का एक तरीका चाहिए, जिसके परिणामस्वरूप सोलर होता है। मुझे पता है कि इस तरह की एक विशेषता अगले संस्करण (1.5) में आ रही है, लेकिन मैं इसके लिए इंतजार नहीं कर सकता। मौजूदा स्थिर संस्करण 1.4 का उपयोग करके डुप्लिकेट को हटाने का सबसे अच्छा तरीका क्या होगा?एसओएलआर 1.4

यह देखते हुए कि मेरे मामले में डुप्लिकेट ढूंढना वास्तव में आसान है (एक स्ट्रिंग फ़ील्ड की तुलना), क्या यह एक फ़िल्टर होना चाहिए, क्या मुझे मौजूदा सर्च कॉम्पोनेंट को ओवरराइट करना चाहिए या नया घटक लिखना चाहिए, या कुछ बाहरी पुस्तकालयों जैसे कैरोट 2 का उपयोग करना चाहिए?

समग्र परिणाम गणना को कम परिणाम को प्रतिबिंबित करना चाहिए।

उत्तर

6

ठीक है, एक समाधान है: इस सुविधा के बारे में नवीनतम समाचार के लिए बस पतन फ़ील्ड पैच लागू करें (http://issues.apache.org/jira/browse/SOLR-236 देखें, मैं आपको http://blog.jteam.nl/author/martijn भी अनुशंसा करता हूं)।

ऐसा करने से आप CollapseComponent पर काम करेंगे। ध्यान दें कि इस सुविधा से जुड़े एक खोज प्रदर्शन गिरावट है।