सौर स्कीमा में परिभाषित डिफ़ॉल्ट रूप से फ़ील्ड काफी अलग हैं।
String
टोकननाइज़ेशन आदि के बिना एक शब्द/वाक्य को सटीक स्ट्रिंग के रूप में संग्रहीत करता है। सटीक मिलानों को संग्रहीत करने के लिए आम तौर पर उपयोगी, उदाहरण के लिए, फ़ेसटिंग के लिए।
Text
आमतौर पर टोकननाइज़ेशन और माध्यमिक प्रसंस्करण (जैसे लोअर-केसिंग इत्यादि) करता है। जब हम वाक्य के भाग से मेल खाते हैं तो सभी परिदृश्यों के लिए उपयोगी।
निम्न नमूना, "This is a sample sentence"
, दोनों क्षेत्रों हम वास्तव में पाठ This is a sample sentence
के लिए खोज string
क्षेत्र से एक हिट पाने के लिए करना होगा करने के लिए अनुक्रमित है, यह sample
के लिए खोज करने के लिए पर्याप्त होता है (या stemmning साथ भी samples
सक्षम) है, जबकि अगर text
फ़ील्ड से हिट प्राप्त करें।
स्रोत
2011-08-25 08:44:27
क्या आप इंडेक्स आकार, इंडेक्स रीड, इंडेक्स सृजन पर भी टिप्पणी कर सकते हैं? – Rahul
टोकनिंग के दौरान आपको एक बड़ा इंडेक्स आकार मिलेगा, आपकी प्रोसेसिंग श्रृंखला पर कितना बड़ा निर्भर करता है। अधिक काम करने के बाद से इंडेक्स निर्माण भी मामूली धीमा होगा। इंडेक्स रीड/सृजन किसी भी तरह से शानदार होगा, इसलिए लाखों दस्तावेजों तक पहुंचने तक इसके बारे में चिंता न करें। –
मैं लाखों दस्तावेजों के माध्यम से पढ़ रहा हूं .. आशा है कि कोई समस्या नहीं है .. इसलिए मैं स्ट्रिंग फ़ील्ड के लिए जा रहा हूं क्योंकि यह सभी मामलों में कुशल लगता है और मुझे टोकननाइज़र/पूर्ण टेक्स्ट खोज की आवश्यकता नहीं है – Rahul