मैं एक संकुचित प्रारूप में निम्नलिखित tuples की एक सूची संग्रहीत करना चाहते हैं और मैं सोच रहा था जो एल्गोरिथ्म मुझेसर्वश्रेष्ठ संपीड़न एल्गोरिदम? (सबसे अच्छा की परिभाषा के लिए नीचे देखें)
- छोटी से छोटी संकुचित आकार देता है
- सबसे तेजी से डी/संपीड़न
- दुविधा यह इष्टतम (दुविधा यह वक्र के "घुटने")
मेरे डेटा इस तरह दिखता है:
(<int>, <int>, <double>),
(<int>, <int>, <double>),
...
(<int>, <int>, <double>)
दो चींटियों में से एक समय में एक बिंदु को संदर्भित करता है और यह बहुत संभावना है कि एक सूची में समाप्त होने वाली संख्याएं एक दूसरे के करीब हैं। दूसरा int एक अमूर्त आईडी का प्रतिनिधित्व करता है और मान करीब होने की संभावना कम होती है, हालांकि वे पूरी तरह से यादृच्छिक नहीं होने जा रहे हैं। डबल एक सेंसर पढ़ने का प्रतिनिधित्व कर रहा है और मूल्यों के बीच कुछ सहसंबंध है, लेकिन शायद यह अधिक उपयोग नहीं है।
यह इंगित करने के लिए धन्यवाद कि मैं पीबी के साथ सामान को क्रमबद्ध कर रहा हूं, इसलिए यह मेरे संदर्भ में एक प्राकृतिक विकल्प है। क्या आप जानते हैं कि क्या वे छोटे अनुक्रमों के साथ दोहराए गए पैटर्न को संपीड़ित करते हैं? मैं आरटीएफ स्पेक भी कर सकता हूं, अगर नहीं। ;-) –
नहीं, यह ऐसा नहीं करता है। हालांकि, अगर आपके पास एक विशिष्ट आवश्यकता थी, तो GZip या कुछ के साथ संपीड़ित डेटा को पकड़ने के लिए 'बाइट्स' सदस्य बनाया जा सकता था। यह spec के बाहर है, इसलिए ग्राहक/सर्वर को इसे पूरी तरह से विस्तार से सहमत होना होगा। –
ठीक है, तो इसका मतलब है कि 3-टुपल्स की एक सूची के बजाय प्रत्येक टुपल सदस्य के लिए तीन क्रमबद्ध सूचियां प्राप्त करने के लिए डेटा को पुन: व्यवस्थित करना मुझे कुछ भी नहीं खरीदेंगे? –