2011-08-24 23 views
38

अपाचे में सौर क्यों हम दोनों को हल करने के लिए हमेशा टेक्स्ट फ़ील्ड पर स्ट्रिंग फ़ील्ड पसंद करने की आवश्यकता है?अपाचे सौर स्ट्रिंग फ़ील्ड या टेक्स्ट फ़ील्ड?

स्ट्रिंग या टेक्स्ट इंडेक्स आकार, इंडेक्स रीड, इंडेक्स सृजन जैसे पैरामीटर को कैसे प्रभावित करता है?

उत्तर

83

सौर स्कीमा में परिभाषित डिफ़ॉल्ट रूप से फ़ील्ड काफी अलग हैं।

String टोकननाइज़ेशन आदि के बिना एक शब्द/वाक्य को सटीक स्ट्रिंग के रूप में संग्रहीत करता है। सटीक मिलानों को संग्रहीत करने के लिए आम तौर पर उपयोगी, उदाहरण के लिए, फ़ेसटिंग के लिए।

Text आमतौर पर टोकननाइज़ेशन और माध्यमिक प्रसंस्करण (जैसे लोअर-केसिंग इत्यादि) करता है। जब हम वाक्य के भाग से मेल खाते हैं तो सभी परिदृश्यों के लिए उपयोगी।

निम्न नमूना, "This is a sample sentence", दोनों क्षेत्रों हम वास्तव में पाठ This is a sample sentence के लिए खोज string क्षेत्र से एक हिट पाने के लिए करना होगा करने के लिए अनुक्रमित है, यह sample के लिए खोज करने के लिए पर्याप्त होता है (या stemmning साथ भी samples सक्षम) है, जबकि अगर text फ़ील्ड से हिट प्राप्त करें।

+0

क्या आप इंडेक्स आकार, इंडेक्स रीड, इंडेक्स सृजन पर भी टिप्पणी कर सकते हैं? – Rahul

+2

टोकनिंग के दौरान आपको एक बड़ा इंडेक्स आकार मिलेगा, आपकी प्रोसेसिंग श्रृंखला पर कितना बड़ा निर्भर करता है। अधिक काम करने के बाद से इंडेक्स निर्माण भी मामूली धीमा होगा। इंडेक्स रीड/सृजन किसी भी तरह से शानदार होगा, इसलिए लाखों दस्तावेजों तक पहुंचने तक इसके बारे में चिंता न करें। –

+1

मैं लाखों दस्तावेजों के माध्यम से पढ़ रहा हूं .. आशा है कि कोई समस्या नहीं है .. इसलिए मैं स्ट्रिंग फ़ील्ड के लिए जा रहा हूं क्योंकि यह सभी मामलों में कुशल लगता है और मुझे टोकननाइज़र/पूर्ण टेक्स्ट खोज की आवश्यकता नहीं है – Rahul

संबंधित मुद्दे