मैं एक ऐसी प्रणाली का निर्माण कर रहा हूं जिसे बाइट्स के ब्लब्स को अपडेट किया गया है, तो यह पता लगाने में सक्षम होना चाहिए। पूरे ब्लॉब को संग्रहीत करने के बजाय (वे 5 एमबी तक हो सकते हैं), मुझे लगता है कि मुझे इसके चेकसम की गणना करनी चाहिए, इसे स्टोर करें और थोड़ी देर बाद उसी चेकसम की गणना करें, यह देखने के लिए कि ब्लॉग अपडेट किया गया है या नहीं।मुझे किस चेकसम एल्गोरिदम का उपयोग करना चाहिए?
लक्ष्य निम्नलिखित (इसी क्रम में) कम करने के लिए है:
- चेकसम के आकार
- गणना करने के लिए समय टकराव की
- इस संभावना को (2 समान हो रहा चेकसम सामग्री किया गया है, भले ही संशोधित)।
हमारे सिस्टम के लिए 1/1,000,000 से अधिक टकराव नहीं है। चिंता सुरक्षा नहीं है, लेकिन बस अद्यतन/त्रुटि का पता लगाने, तो दुर्लभ टक्कर ठीक है। (यही कारण है कि मैंने इसे कम करने के लिए चीजों में आखिरी बार रखा)।
इसके अलावा, हम स्वयं टेक्स्ट के ब्लब्स को संशोधित नहीं कर सकते हैं।
बेशक, md5
, crc
या sha1
दिमाग में आते हैं, और यदि मैं एक त्वरित समाधान चाहता था, तो मैं इसके लिए जाऊंगा। हालांकि, एक त्वरित समाधान से अधिक, मैं देख रहा हूं कि क्या हो सकता है विभिन्न तरीकों की तुलना के साथ-साथ पेशेवरों और विपक्ष।
मुझे यह सवाल किसी समुदाय में बदलने में खुशी है, अगर यह समझ में आता है! –
आपकी चिंता क्या है, यहां? क्या आप बस यह देखने के लिए जांच कर रहे हैं कि कुछ समय पहले से आपके डेटा ब्लॉब्स बदल गए हैं, या आप किसी दुर्भावनापूर्ण परिवर्तन का पता लगाने की कोशिश कर रहे हैं? – dajames
बस यह देखने का प्रयास कर रहा है कि उनमें कोई अपडेट किया गया है या नहीं। –