दस्तावेजों के बजाय कहें मेरे पास छोटे पेड़ हैं जिन्हें मुझे लुसीन इंडेक्स में स्टोर करने की आवश्यकता है। मैं इसे कैसे करूं?लुसीन/सोलर/लोचदार खोज सूचकांक या नोएसक्यूएल डीबी में पेड़ डेटा कैसे स्टोर करें?
पेड़ में एक उदाहरण नोड:
class Node
{
String data;
String type;
List<Node> children;
}
ऊपर नोड में "डाटा" सदस्य चर शब्दों का एक अंतरिक्ष अलग स्ट्रिंग, ताकि संपूर्ण-पाठ खोज होने की जरूरत है है। "प्रकार" सदस्य चर केवल एक शब्द है।
खोज क्वेरी एक पेड़ ही होगी और दोनों डेटा खोजेगी और प्रत्येक नोड में टाइप करेगी और एक मैच के लिए पेड़ की संरचना भी होगी। एक बच्चे नोड के खिलाफ मिलान करने से पहले, क्वेरी पहले माता-पिता नोड डेटा से मेल खाना चाहिए और टाइप करें। डेटा मान पर लगभग मिलान स्वीकार्य है।
इस तरह के डेटा को इंडेक्स करने का सबसे अच्छा तरीका क्या है? यदि लुसीन सीधे इन आंकड़ों को अनुक्रमणित करने का समर्थन नहीं करता है तो क्या यह सोलर या लोचदार खोज द्वारा किया जा सकता है?
मैंने neo4j पर एक त्वरित नज़र डाली, लेकिन ऐसा लगता है कि यह एक बड़ा ग्राफ डीबी में स्टोर करता है, न कि बड़े पेड़ संरचनाओं के बड़े संग्रह (अरबों या ट्रिलियन कहें)। या मेरी समझ गलत थी?
इसके अलावा, गैर-लुसीन आधारित नोएसक्यूएल समाधान इस के लिए बेहतर है?
जब आप खोज करते हैं तो आप क्या खोज रहे हैं। यदि आपके पास नोडे के बच्चे के रूप में नोडबी है, और नोडबी में फूड की खोज करते समय टेक्स्ट फू है, तो क्या आप नोडेब, या नोडे वापस करना चाहते हैं? – sbridges
प्रश्नों का पेड़ संरचना और वृक्ष डेटा के खिलाफ मिलान किया जाएगा। तो यदि नोडे में डेटा पहले ही मेल खाया गया है तो नोडब में फूड की घटना पूरी मैच बन जाएगी। –
क्या आप कह रहे हैं कि फूड नोडे और नोडब में होना चाहिए? या उस प्रकार को नोडा में मेल खाना चाहिए, लेकिन यदि आपको नोडब में टाइप मैचों का मिलान नहीं है तो आपको परवाह नहीं है। – sbridges