bloom_filter_fp_chance और read_repair_chance दो अलग-अलग चीजों को नियंत्रित करता है। आम तौर पर आप उन्हें अपने डिफ़ॉल्ट मानों पर सेट कर देंगे, जो कि अधिकांश सामान्य उपयोग मामलों के लिए अच्छी तरह से काम करना चाहिए।
bloom_filter_fp_chance डिस्क पर संग्रहीत एसएसटीबल्स के लिए ब्लूम फ़िल्टर डेटा की सटीकता को नियंत्रित करता है। ब्लूम फ़िल्टर को स्मृति में रखा जाता है और जब आप पढ़ते हैं, तो कैसंड्रा ब्लूम फ़िल्टर की जांच करेगा ताकि यह देखने के लिए कि कौन सी एसएसटीबल्स आपके द्वारा पढ़ी जा रही कुंजी के लिए डेटा हो। एक ब्लूम फ़िल्टर अक्सर झूठी सकारात्मकता देता है और जब आप वास्तव में एसएसटीबल पढ़ते हैं, तो यह पता चला है कि कुंजी एसएसटीबल में मौजूद नहीं है और इसे पढ़ने का समय बर्बाद था। ब्लूम फ़िल्टर के लिए उपयोग की जाने वाली सटीकता जितनी बेहतर होगी, उतना ही कम झूठा सकारात्मक होगा (लेकिन जितनी अधिक मेमोरी की आवश्यकता होगी)।
प्रलेखन से:
0 Enables the unmodified, effectively the largest possible, Bloom filter
1.0 Disables the Bloom Filter
The recommended setting is 0.1. A higher value yields diminishing returns.
तो उच्च संख्या एक झूठी सकारात्मक (एफपी) के एक उच्च मौका देता है जब खिलने फिल्टर पढ़ने।
read_repair_chance संभावना को नियंत्रित करता है कि कुंजी के पढ़ने को उस कुंजी के लिए अन्य प्रतिकृतियों के विरुद्ध चेक किया जाएगा। यह उपयोगी है अगर आपके सिस्टम में नोड्स के लगातार डाउनटाइम होते हैं जिसके परिणामस्वरूप डेटा सिंक हो रहा है। यदि आप बहुत सारे पढ़ते हैं, तो पढ़ने की मरम्मत धीरे-धीरे डेटा को सिंक में लाएगी क्योंकि आप नोड्स पर पूर्ण मरम्मत चलाने के बिना पढ़ते हैं। उच्च सेटिंग्स अधिक पृष्ठभूमि को मरम्मत और अधिक संसाधनों का उपभोग करेगी, लेकिन डेटा को जितनी जल्दी पढ़ती है उतनी जल्दी सिंक करेगी।
इन सेटिंग्स पर दस्तावेज़ देखें here।
स्रोत
2015-08-03 17:57:08
धन्यवाद जिम! – Jagadeesh