विकिपीडिया, दुख की बात है ... डेटाबेस के रूप में कुछ प्रकार के एक्सएमएल (?) में डेटाबेस में प्रत्येक संशोधन को पाठ के रूप में रखता है।
wikipedia database schema पर एक नज़र डालें। विशेष रूप से हालिया परिवर्तन और पाठ।
इसलिए, उनके पास "जीवविज्ञान" पृष्ठ की पहली प्रतिलिपि के लिए अद्भुत ओ (1) लुकअप हैं। 2010-2012 में $ 8mil अमरीकी डालर से गुब्बारे के लिए विकिपीडिया के technology cost को 2011-2012 में 12 मिलियन अमरीकी डॉलर तक पहुंचाने का दुर्भाग्यपूर्ण साइड इफेक्ट है। यह एचडीडी (और बाकी सब कुछ) सस्ता हो रहा है, और अधिक महंगा नहीं है।
प्रत्येक फ़ाइल को रखने के संशोधन नियंत्रण के लिए बहुत कुछ। गिट एक प्यारा दृष्टिकोण लेता है। Is the git storage model wasteful? देखें।
यह उपरोक्त विधि के समान, प्रत्येक फ़ाइल को संग्रहीत करता है। एक बार रेपो द्वारा ली गई जगह एक निश्चित सीमा से अधिक हो जाती है, तो यह एक ब्रूट फोर्स रिपैक करता है (यह निर्धारित करने के लिए एक विकल्प है कि यह कितना मुश्किल कोशिश करता है - - विन्डो = [एन], --depth = [N]) जिसमें घंटों लग सकते हैं।यह कहा गया रेकैक (रिकर्सली डेल्टा के लिए डेल्टा और लापरवाही संपीड़न के संयोजन का उपयोग करता है, फिर आपके पास जो भी बिट्स है, उस पर लापरवाही लागू करें)।
एसवीएन जैसे अन्य सरल डेल्टा संपीड़न का उपयोग करते हैं। (स्मृति से, जिसे आप भरोसा नहीं करना चाहिए)।
फुटनोट: डेल्टा संपीड़न वृद्धिशील परिवर्तनों को स्टोर करता है। लापरवाह संपीड़न ज़िप, रार, आदि की तरह काफी है