कोई फ्रांसीसी लोकेल के साथ चरित्र के साथ सॉर्ट कमांड के व्यवहार की व्याख्या कर सकता है?सॉर्ट कमांड फ्रेंच लोकेल में उदासीन रूप से "œ" और "ओई" क्यों करता है?
$ file file.txt
file.txt: UTF-8 Unicode text, with CRLF line terminators
$ wc -l file.txt
4 file.txt
$ cat file.txt
cœz
coez
coe
cœ
$ sort file.txt
coe
cœ
cœz
coez
$ sort -d file.txt
cœ
coe
coez
cœz
$ env | grep -P "(LC|FR)"
LANG=fr_FR.UTF-8
तथ्य यह है कि "ँ" कम या से अधिक है "ँ" एक नियमित तरह के मामले में यादृच्छिक लगता है, जबकि चरित्र बस एक शब्दकोश प्रकार (sort -d
) के मामले में नजरअंदाज कर दिया है।
मुझे लगता है कि यह संयोजन के साथ कुछ करने के लिए है, लेकिन मुझे यहां कुछ अंतर्दृष्टि चाहिए।
क्या आप वाकई फ्रेंच फ्रेल में हैं? 'LC_ALL' का मूल्य क्या है? – unwind
मैं खिड़कियों के नीचे सिग्विन का उपयोग कर रहा हूं। एलसी_ALL खाली है। तथ्य यह है कि एक फ्रेंच लोकेल मेरा अनुमान है, मैं इसे कैसे देख सकता हूं? –
यदि "œ" बिल्कुल "ओई" के बराबर है तो परिणामों को अस्थिरता द्वारा समझाया जा सकता है। देखें कि '-s' विकल्प कब दिया जाता है जब आपको क्या परिणाम मिलते हैं। –