रेडडिट के सह-संस्थापक ने लाखों उपयोगकर्ताओं को स्केल करते समय उनके मुद्दों पर एक प्रस्तुति दी। सारांश here उपलब्ध है।"ओपन स्कीमा" के साथ डेटाबेस - अच्छा या बुरा विचार?
बजाय, वे एक बात टेबल और एक डेटा तालिका रखें:
क्या मुझे हैरान कर दिया बिंदु 3 है। रेडडिट में सबकुछ एक चीज है: उपयोगकर्ता, लिंक, टिप्पणियां, सब्रेडडिट, पुरस्कार इत्यादि। चीजें सामान्य गुणों को ऊपर/नीचे वोट, एक प्रकार और सृजन तिथि जैसी रखती हैं। डेटा तालिका में तीन कॉलम हैं: चीज़ आईडी, कुंजी, मान। प्रत्येक विशेषता के लिए एक पंक्ति है। शीर्षक, यूआरएल, लेखक, स्पैम वोट इत्यादि के लिए एक पंक्ति है। जब वे नई विशेषताएं जोड़ते हैं तो उन्हें अब डेटाबेस के बारे में चिंता करने की ज़रूरत नहीं है। उन्हें नई चीजों के लिए नई टेबल जोड़ने या उन्नयन के बारे में चिंता करने की ज़रूरत नहीं थी।
यह मेरे लिए एक भयानक विचार जैसा प्रतीत होता है, लेकिन ऐसा लगता है कि रेडडिट के लिए काम किया है। क्या यह सामान्य रूप से एक अच्छा विचार है, यद्यपि? या क्या यह रेडडिट की एक विशिष्टता है जो उनके लिए काम करने के लिए हुई?
असल में बात में हफमैन रिपोर्ट बनाने के बारे में बात करता है और वे टेक्स्ट फ़ाइल में डेटा का एक गुच्छा निर्यात करके और अन्यत्र इसका विश्लेषण करके कैसे करते हैं https://vimeo.com/10506751 m24: 50 –
रेडडिट में कुछ कम है डेटा अखंडता आवश्यकताओं। ऐसा नहीं है कि वे तारीख या पूर्णांक मान संग्रहीत कर रहे हैं जो कुछ श्रेणियों के बीच होना चाहिए या जटिल व्यावसायिक नियम हैं। यानी, डेटा की शुद्धता Reddit जैसी साइट के लिए वास्तव में महत्वपूर्ण नहीं है; यह सिर्फ अधिक सही होने की जरूरत है। हालांकि, LOB ऐप्स गलतता के इतने सहनशील नहीं हैं। Reddit का डिज़ाइन डेटा को कैप्चर करने पर केंद्रित नहीं है। हालांकि, शुद्धता के बारे में बात यह है कि जब आप इसकी परवाह करते हैं, तो यह असाधारण रूप से महंगा है कि इसे पहले से संबोधित न करें। – Thomas