2011-08-24 15 views
6

में प्रति नोड कितना डेटा स्टोर कर सकता है मुझे Neo4j नोड्स में यूनिकोड टेक्स्ट स्ट्रिंग के बड़े हिस्से को सहेजने की आवश्यकता है। दस्तावेज डेटा के आकार के बारे में कुछ भी नहीं बताता है जो प्रति नोड स्टोर कर सकता है।नियो 4j

क्या कोई इसे जानता है?

+0

आपके मामले में "बड़ा हिस्सा" क्या है? – nawroth

उत्तर

0

नियो 4j वस्तुओं के बीच संबंधों के प्रबंधन के लिए एक बहुत अच्छा समाधान है। जैसा कि आप पहले ही जानते हैं कि इन रिश्तों में संपत्तियों के साथ-साथ नोड्स भी हो सकते हैं। लेकिन मुझे लगता है कि आप इन नोड्स पर डेटा का "बड़ा हिस्सा" स्टोर नहीं कर सकते हैं। मुझे लगता है कि Neo4j का उद्देश्य अन्य डेटाबेस जैसे मोंगो डीबी या यहां तक ​​कि माइस्क्ल के साथ भी किया जाना था। आपको पहली बार आवश्यक जानकारी "वास्तव में तेज़" मिलती है और फिर किसी अन्य इंजन का उपयोग करके इसके लिए देखो। मेरी परियोजनाओं पर मैं उपयोगकर्ता नाम, नाम, जन्मतिथि, आईडी, और इस तरह की जानकारी स्टोर करता हूं, लेकिन बहुत बड़े टेक्स्ट स्ट्रिंग्स नहीं।

+0

यह शुद्ध अटकलें की तरह लगता है और अन्य जवाब यहां और दूसरी जगहों के एकदम विपरीत है। वास्तव में –

+0

। कम से कम यही वह है जिसे मैं 2011 में वापस जानता था लेकिन तब से चीजें बदल गई हैं। यह बात बताने के लिए धन्यवाद। –

3

नियो 4j डिफ़ॉल्ट रूप से ल्यूसीन का उपयोग करके अनुक्रमित है। ल्यूसीन को एक पूर्ण पाठ खोज टूलबॉक्स के रूप में बनाया गया था (सोलर वास्तव में खोज इंजन कार्यान्वयन के साथ)। चूंकि ल्यूसीन का उद्देश्य बड़ी मात्रा में टेक्स्ट खोजना था, इसलिए मेरा संदेह यह है कि आप जितना चाहें उतना टेक्स्ट नोड में डाल सकते हैं और यह ठीक काम करेगा।

5

मैं सिर्फ कोशिश की neo4j वेब इंटरफेस के साथ निम्नलिखित:

मैं 26 वर्णों की एक लाइन में लिखा था और 32000 लाइनों, जो 832,000 पात्रों की कुल बनाता है के माध्यम से यह दोहराया गया।

मैंने एक संपत्ति "टेक्स्ट" के साथ एक नोड बनाया और इसमें मेरा टेक्स्ट कॉपी किया, और यह पूरी तरह से काम किया।

मैं पंक्तियों के अंत में सफेद रिक्त स्थान के साथ 64000 लाइनों के साथ फिर से कोशिश की, 1,728,000 पात्रों में से एक कुल के साथ। एक नया नोड बनाया, फिर नोड पूछताछ की और आकार को जांचने के लिए परिणाम को वापस कॉपी किया (जिसे आप कभी नहीं जानते), और डब्ल्यूसी ने मुझे 1728001 दिया (मुझे लगता है कि प्रतिलिपि/पेस्ट प्रक्रिया में एक त्रुटि होनी चाहिए)।

यह शिकायत नहीं प्रतीत होता।

FYI करें इस 4 के एक औसत आकार और एक अंतरिक्ष (5 वर्ण), और प्रति पृष्ठ 300 शब्दों के साथ 1000 पृष्ठों की एक किताब की 345,600 शब्द के साथ एक पाठ के बराबर है।

मुझे नहीं पता कि यह बहुत सारे नोड्स होने पर प्रदर्शन को कैसे प्रभावित कर सकता है। यह अच्छी तरह से इसी वजह से काम नहीं करता है, तो आप हमेशा एक और दस्तावेज़ उन्मुख डेटाबेस एक रास्ता के रूप में पाठ (या एक फ़ाइल की बस पथ को पुनः प्राप्त करने के लिए एक आईडी के रूप में संबंधों के बारे में जानकारियां भंडारण, एक प्रॉपर्टी ID से के लिए neo4j होने पर विचार कर सकते संपत्ति)।

संबंधित मुद्दे