मैं बड़े डेटा का विश्लेषण करने के लिए ग्राफ का उपयोग करने के साथ खेल रहा हूं। यह बहुत अच्छा और वास्तव में मजेदार काम कर रहा है, लेकिन मुझे आश्चर्य है कि डेटा क्या बड़ा हो सकता है और बड़ा हो सकता है?क्या ग्राफ hbase स्टोर करना संभव है? यदि ऐसा है तो आप ग्राफ संरचना का समर्थन करने के लिए डेटाबेस को कैसे मॉडल करते हैं?
मुझे बताएं कि कोई अन्य समाधान है या नहीं, लेकिन मैंने हबेस की कोशिश करने के बारे में सोचा क्योंकि यह क्षैतिज रूप से स्केल करता है और मैं ग्राफ पर एनालिटिक्स चलाने के लिए हंसूप प्राप्त कर सकता हूं (मेरा अधिकांश कोड पहले ही जावा में लिखा गया है), लेकिन मुझे यकीन नहीं है एक nosql डेटाबेस पर ग्राफ को कैसे व्यवस्थित करें? मुझे पता है कि प्रत्येक नोड डेटाबेस में एक प्रविष्टि हो सकता है लेकिन मुझे यकीन नहीं है कि किनारों का मॉडल कैसे करें और उन्हें गुण जोड़ें (जैसे नोड्स, विशेषताओं, पेजरैंक, किनारों पर वजन, आदि ..)।
बड़ी टेबल और मानचित्र कम होने के बाद कैसे hbase/hadoop का मॉडल किया गया है, मुझे संदेह है कि ऐसा करने का कोई तरीका है लेकिन यह सुनिश्चित नहीं है कि कैसे। कोई सुझाव?
इसके अलावा, क्या यह समझ में आता है कि मैं क्या करने की कोशिश कर रहा हूं? या क्या यह बड़े डेटा ग्राफ के लिए बेहतर समाधान है?
बिंदु पर - आप हब्स में ग्राफ स्टोर कर सकते हैं। लेकिन यह लिंक किए गए डेटा को संभालने का सबसे अच्छा समाधान नहीं है। ट्रैवर्सिंग समस्या प्रवण होगी। नोडिड (src node) को पंक्ति कुंजी के रूप में उपयोग करने के मामले में आपको मूल्यों (संपत्ति मानों) के आधार पर पुनर्प्राप्ति के लिए फ़िल्टर का उपयोग करने की आवश्यकता होगी। BigData का समर्थन करने वाले उपलब्ध ग्राफ़ डेटाबेस का उपयोग करने का बेहतर तरीका होगा। यह सिर्फ एक सुझाव है, जवाब नहीं, इसलिए मैं इसे टिप्पणी ब्लॉक में जोड़ रहा हूं। –