मैं हाइव का उपयोग करके एक नया हैडऑप-आधारित डेटा गोदाम तैयार कर रहा हूं और मैं सोच रहा था कि इस संदर्भ में क्लासिक स्टार/स्नोफ्लेक स्कीमा अभी भी "मानक" हैं या नहीं।क्या स्टार स्कीमा अभी भी एक बड़े डेटा-गोदाम के लिए आवश्यक है?
बिग डेटा सिस्टम अनावश्यकता को गले लगाते हैं ताकि पूरी तरह से सामान्यीकृत स्कीमा आमतौर पर खराब प्रदर्शन कर सकें (उदाहरण के लिए, एचबीएसई या कैसंद्रा जैसे नोएसक्यूएल डेटाबेस में)।
अभी भी हाइव के साथ स्टार-स्कीमा डेटा वेयरहाउस बनाने का सबसे अच्छा अभ्यास है?
क्या यह नए स्तंभ फ़ाइल प्रारूपों का शोषण करके पंक्ति-व्यापी (reduntant) तालिकाओं को बेहतर ढंग से डिजाइन कर रहा है?
की उपयोगिता की चर्चा ऊपर लिखा है क्यों नहीं अमेज़न Redshift उपयोग करें, हम एक आधुनिक बड़ा डेटा DWH के बारे में बात कर रहे हैं तो क्या होगा? – Guy
आपको अपने तथ्य और मंदांक की मात्रा लिखनी चाहिए – jangorecki