आम तौर पर, हैशिंग का लक्ष्य निरंतर कार्य को एक अलग में बदलना है: इनपुट में एक छोटा सा परिवर्तन आउटपुट में एक बड़ा बदलाव होना चाहिए। हालांकि, क्या कोई हैशिंग एल्गोरिदम है जो (बहुत) मोटे तौर पर बोल रहा है, समान इनपुट के लिए समान लेकिन (अभी भी अलग) हैश करता है?हैशिंग समानता
(इस के उपयोग का एक उदाहरण देखने के लिए कि क्या दो फ़ाइलों "समान" समानता के लिए उनके हैश की जाँच करके कर रहे हैं होगा। बेशक, कुछ विफलता हमेशा स्वीकार्य है।)
आप "समान" को कैसे परिभाषित करते हैं? – thkala
लगभग उसी लंबाई में दो धाराएं और उसी क्रम में लगभग उसी डेटा को समान माना जाएगा। (ध्यान दें कि मुझे यह कहना जरूरी नहीं है कि "क्या ये दो समान हैं?" एक बुलियन के रूप में, बल्कि किसी प्रकार की संख्या-रेटिंग प्रणाली के रूप में। उदाहरण के लिए, [1, 2, 3, 4] अधिक समान हो सकता है [1, 2, 3] से [4, 3, 2, 1] ...) – Mehrdad
हैश फ़ंक्शन का पूरा बिंदु यह सुनिश्चित करना है कि इनपुट के किसी भी बिट में बदलाव का मौका होना चाहिए आउटपुट के * हर * बिट बदल रहा है। – Pointy