मुझे मुश्किल से संपीड़न के बारे में कुछ पता है, इसलिए मेरे साथ भालू (यह शायद एक बेवकूफ और दर्दनाक स्पष्ट सवाल है)।एक्सएमएल के लिए सर्वश्रेष्ठ संपीड़न एल्गोरिदम?
तो मान लें कि मेरे पास कुछ टैग के साथ एक एक्सएमएल फ़ाइल है।
<verylongtagnumberone>
<verylongtagnumbertwo>
text
</verylongtagnumbertwo>
</verylongtagnumberone>
अब कहें कि मेरे पास कई एक्सएमएल फाइलों में कई विशेषताओं के साथ इन बहुत लंबे टैग का एक गुच्छा है। मुझे उन्हें सबसे छोटे आकार में संपीड़ित करने की आवश्यकता है। सबसे अच्छा तरीका एक्सएमएल-विशिष्ट एल्गोरिदम का उपयोग करना होगा जो व्यक्तिगत टैग छद्म शब्द जैसे vlt1 या vlt2 असाइन करता है। हालांकि, यह एक तरह से 'खुला' नहीं होगा जैसा कि मैं जाने की कोशिश कर रहा हूं, और मैं डेफलेट या एलजेड जैसे एक सामान्य एल्गोरिदम का उपयोग करना चाहता हूं। यह भी मदद करता है अगर संग्रह एक .zip फ़ाइल था।
चूंकि मैं सादे पाठ (छवियों जैसी कोई बाइनरी फाइल) से निपट रहा हूं, मुझे एक एल्गोरिदम चाहिए जो सादा पाठ के अनुरूप हो। कौन सा सबसे छोटा फ़ाइल आकार उत्पन्न करता है (लापरवाह एल्गोरिदम को प्राथमिकता दी जाती है)?
वैसे, परिदृश्य यह है: मैं दस्तावेजों के लिए मानक बना रहा हूं, जैसे ओडीएफ या एमएस ऑफिस एक्सएमएल, जिसमें एक .zip में पैक की गई एक्सएमएल फाइलें होती हैं।
संपादित करें: 'एन्क्रिप्शन' चीज एक टाइपो थी; यह अवे बेन 'संपीड़न' होना चाहिए।
यह एन्क्रिप्शन से कैसे संबंधित है? और सरल जवाब ज़िप को संपीड़न करने देना है: यह व्यापक रूप से उपलब्ध है, पाठ पर एक सभ्य नौकरी करता है, और "सबसे छोटा आकार संभव" खोजने के लिए समय के लायक नहीं है। – kdgregory
क्यों ओपनएक्सएमएल का उपयोग न करें? यह मूल रूप से आप चाहते हैं :)। सुनिश्चित नहीं है कि यह सबसे अच्छा संपीड़न है, लेकिन मुझे अब तक यह पसंद है। और यदि आप इसे पहले से नहीं जानते हैं, तो OpenXML मूल रूप से एक ज़िप फ़ाइल है, इसलिए आप अपने Office 2007 दस्तावेज़ों को .zip फ़ाइल (यानी some.docx को something.zip) के रूप में नामित कर सकते हैं और इसे ज़िप फ़ाइल के रूप में खोल सकते हैं। अंदर मूल रूप से एक्सएमएल का गुच्छा है। –
आप बस ज़िप फ़ाइल में एक्सएमएल फाइलों का एक गुच्छा का उपयोग कर सकते हैं, और जो भी फाइल एक्सटेंशन आप चाहते हैं।क्यों llongtagnumbers ??? –