उपयोगकर्ताओं को छोड़कर अधिकांश उत्तरों स्लेटन, रॉचन, पॉल एम्स्ट्रांग खराब हैं क्योंकि यह संपीड़न तकनीक के बिना एक-एक-एक शुद्ध भंडारण के बारे में है।
3 जीबी न्यूक्लियोटाइड्स के साथ मानव जीनोम बाइट्स के 3 जीबी से मेल खाता है और ~ 750 एमबी नहीं है। एनसीबीआई के अनुसार निर्मित "हैप्लाइड" जीनोम वर्तमान में 3436687 केबी या 3.436687 जीबी आकार में है। अपने लिए here देखें।
हैप्लोइड = गुणसूत्र की एक प्रति। डिप्लोइड = हैप्लोइड के दो संस्करण। मनुष्यों के पास 22 अद्वितीय गुणसूत्र x 2 = 44 हैं। पुरुष 23 वां गुणसूत्र एक्स, वाई है और कुल 46 बनाता है। महिलाओं 23 वें क्रोम। एक्स, एक्स है और इस प्रकार कुल 46 बनाता है।
पुरुषों के लिए यह एचडीडी पर डेटा स्टोरेज में 23 + 1 गुणसूत्र होगा और 23 गुणसूत्रों के लिए, अब वर्णित छोटे अंतरों और फिर जवाब में बताएगा। एक्स क्रोम। पुरुषों से एक्स क्रोम के बराबर है। मादाओं से
इस प्रकार जीनोम (23 + 1) को स्मृति में लोड करना फ्लैश-फाइलों से निर्मित डेटाबेस का उपयोग करके ब्लास्ट के माध्यम से भागों में किया जाता है। ज़िप्ड संस्करणों के बावजूद या न्यूक्लियोटाइड नहीं संकुचित होने के लिए शायद ही कभी हैं। शुरुआती दिनों में उपयोग की जाने वाली चालों में से एक टंडेम दोहराने के लिए था (छोटे कोडिंग के साथ GACGACGAC उदा। "3 जीएसी"; 9बीटी से 4byte)। कारण हार्डड्राइव स्पेस को बचाने के लिए था (7.200 आरपीएम और एससीएसआई कनेक्टर के साथ 500 बीएम -2 जीबी एचडीडीडी प्लेटर्स का क्षेत्र)।अनुक्रम खोज के लिए यह क्वेरी के साथ भी किया गया था।
"कोडित न्यूक्लियोटाइड" भंडारण पत्र प्रति 2-बिट होगा तो आप एक बाइट के लिए मिलती है:
एक = 00
सी = 01
जी = 10
टी = 11
कोडिंग के 1 बाइट के लिए केवल 1,2,3,4,5,6,7 और 8 पदों से पूरी तरह लाभ प्राप्त करते हैं। उदाहरण के लिए संयोजन 00.01.10.11 "ACTG" के अनुरूप है। यह फ़ाइल आकार में 4 गुणा कम करने के लिए अकेला है क्योंकि हम अन्य उत्तरों में देखते हैं। इस प्रकार 3.4 जीबी को 0.85 9 7175 जीबी तक घटा दिया जाएगा ... ~ 860MB एक तत्काल आवश्यक रूपांतरण कार्यक्रम (23 केबी -4 एमबी) सहित।
लेकिन ... जीवविज्ञान में आप कुछ पढ़ने में सक्षम होना चाहते हैं इस प्रकार संपीड़न gzipped पर्याप्त से अधिक है। अनजिप आप अभी भी इसे पढ़ सकते हैं। यदि इस बाइट भरने का उपयोग किया गया था तो डेटा को पढ़ने में मुश्किल हो जाती है। यही कारण है कि फास्टा-फाइलें वास्तविकता में सादे-पाठ फ़ाइलें हैं।
परमाणुओं की संख्या के लिए, यह संरचना पर निर्भर करता है। ए और टी जी और सी से छोटे अणु हैं। अणु की संरचना गोमांस है, हालांकि, इसकी परमाणु संरचना नहीं है, इसलिए यह वास्तव में एक बहुत ही उपयोगी गणना नहीं है। (इसके लिए क्या लायक है, उदाहरण के लिए ए अणु उर्फ [deoxyadenosine] (https://en.wikipedia.org/wiki/Deoxyadenosine) C10H13N5O3 है इसलिए 31 परमाणु।) – tripleee
यह भी देखें https://www.biostars.org/p/5514/ –
उपयोगकर्ताओं के स्लेटन के अलावा, पॉल एम्स्ट्रांग और राउचेन दिए गए सभी अन्य उत्तरों को इसके सार में या पूर्ण से बहुत गलत हैं। जवाब में उपयोगकर्ता (विफल) संपीड़न विधियों का उल्लेख किया है या खराब समझाया गया है। जीनोम के 4 गुना डाउनसाइजिंग को स्पष्ट करने के लिए मेरा जवाब देखें जैसा कि कई उत्तरों में देखा गया है। – ZF007