2012-11-07 11 views
29

मैंने गुस्सा किया है (ठीक है, डक डकगोएड, वास्तव में) जब तक मैं चेहरे में नीला नहीं हूं, लेकिन en-GB या fr-CA प्रकार के भाषा कोडों की सूची नहीं मिल पाती है।मुझे भाषा + क्षेत्र कोड की एक सूची कहां मिल सकती है?

घटकों के बारे में उत्कृष्ट संसाधन हैं, विशेष रूप से W3C I18n page, लेकिन मैं एक साधारण वर्णमाला सूची की उम्मीद कर रहा था, यदि संभव हो तो काफी कैननिकल (this one जैसे कुछ)। नहीं मिल रहा।

क्या कोई मुझे सही दिशा में इंगित कर सकता है? बहुत धन्यवाद!

+0

लिंक आप * प्रदान की है * सरकारी रजिस्ट्री। उस दस्तावेज़ से क्या गुम है? –

+0

@ jorg-w-mittag - यह बेवकूफ़ हो सकता है, लेकिन मैं उस प्रकार के सामान्य संयोजनों की पूरी तरह से पूरी सूची की उम्मीद कर रहा था, न केवल पृथक उप-टैग। –

+3

मुझे मिली सबसे सटीक सूची है [यह] (https://msdn.microsoft.com/en-us/library/ee825488%28v=cs.20%29.aspx?f=255&MSPPError=-2147217396) –

उत्तर

34

कई भाषा कोड सिस्टम और कई क्षेत्र कोड सिस्टम, साथ ही साथ उनके संयोजन भी हैं। जैसा कि आप डब्ल्यू 3 सी पेज का उल्लेख करते हैं, मुझे लगता है कि आप BCP 47 में परिभाषित सिस्टम का जिक्र कर रहे हैं। यह प्रणाली इस अर्थ में ऑर्थोगोनल है कि एन-जीबी और एफआर-सीए जैसे कोड बस एक भाषा कोड और एक क्षेत्र कोड जोड़ते हैं। इसका मतलब है कि संभावित संयोजनों की एक बड़ी संख्या है, जिनमें से अधिकांश एब-एएक्स की तरह कम समझ में आते हैं, जिसका अर्थ है आल्खाज़ आलैंड में बोली जाती है (मुझे लगता है कि कोई भी नहीं, अभी भी कोई भी समुदाय कम है, वहां अब्खाज बोलता है, हालांकि यह सैद्धांतिक रूप से है निश्चित रूप से संभव)।

इसलिए भाषा-क्षेत्र संयोजनों की कोई भी सूची संयोजनों की एक व्यावहारिक सूची होगी जो कुछ अर्थों में महत्वपूर्ण हैं, या कुछ विशेष अर्थों में कुछ सॉफ्टवेयर द्वारा समर्थित हैं।

आपके द्वारा पाया गया विनिर्देश सामान्य सिद्धांतों और विभिन्न "उपटैग" (जैसे प्राथमिक भाषा कोड और क्षेत्र कोड) पर आधिकारिक स्रोतों को परिभाषित करता है। सबसे महत्वपूर्ण भागों के लिए, आधिकारिक पंजीकरण प्राधिकरण three- and two-letter ISO 639 codes भाषाओं के लिए रखता है, और आईएसओ साइट में two-letter ISO 3166 codes क्षेत्रों के लिए है। सूचियां काफी पठनीय हैं, और मुझे इन प्राथमिक संसाधनों के अलावा विशेष रूप से संभावित परिवर्तनों के अलावा अन्य उपयोग करने पर विचार करने का कोई कारण नहीं दिखता है। http://unicode.org/repos/cldr-tmp/trunk/diff/supplemental/index.html और भी बेहतर, आप इसे एक XML स्वरूप में हो सकता है (सूची पार्स करने के लिए आदर्श) और प्रत्येक भाषा के द्वारा प्रयोग किया जाता भी हमेशा की तरह लेखन प्रणालियों के साथ: http://unicode.org/repos/cldr/trunk/common/supplemental/supplementalData.xml (में देखो/

+1

पूर्ण स्पष्टीकरण के लिए धन्यवाद: आपने स्पष्ट रूप से मेरे प्रश्न को समझ लिया, और समझाया कि क्यों (शायद) मुझे वह उत्तर नहीं मिलेगा जिसके लिए मैं उम्मीद कर रहा था! यह जानना अच्छा है। –

+0

संयोजनों की एक कैनोलिक सूची होना वास्तव में बहुत अच्छा होगा जो हमारे उन लोगों के लिए समझ में आता है जो यह भी नहीं जानते कि अबखाज़ और आलैंड क्या हैं। बहुत बुरा यह अस्तित्व में नहीं है। – melinath

+0

वे पठनीय हो सकते हैं, लेकिन वे कई भाषा टैगिंग आवश्यकताओं के लिए भी अपर्याप्त हैं। व्यक्तिगत रूप से मुझे आशा है कि glottolog.org पर विकास में भाषा सूची एक नया मानक बन जाएगा ... – pat

6

यहाँ खेलने में 2 घटक होते हैं:

  1. जो आम तौर पर ISO 639-1 alpha-2
  2. क्षेत्र टैग जो आम तौर पर द्वारा ISO 3166-1 alpha-2

आप मिश्रण कर सकते हैं और मैच परिभाषित किया गया है द्वारा परिभाषित किया गया भाषा टैग भाषाएं और क्षेत्र जो भी संयोजन आपको समझ में आता है, इसलिए सभी संभावनाओं की कोई सूची नहीं है।

बीटीडब्ल्यू, आप प्रभावी रूप से BCP47 tag का उपयोग कर रहे हैं, जो प्रत्येक लोकेल सेगमेंट के मानकों को परिभाषित करता है।

+0

"... सभी संभावनाओं की कोई सूची नहीं है।" मैंने जो काम किया है उतना ही कम, और यह जुक्का के पूर्ण स्पष्टीकरण का "कार्यकारी" सारांश है, मुझे लगता है। अभी भी मुझे लगता है कि * आम * संयोजनों की एक सूची उपलब्ध हो सकती है, लेकिन ओटीओएच, ऐसा लगता है कि मैं इस तरह महसूस करने में थोड़ा अलग हो सकता हूं! :) –

5

यूनिकोड इस तरह के एक सूची रखता है LanguageData)

2

हम एक काम सूची है कि हम से दूर काम Localizejs के लिए संदर्भित भाषा कोड/भाषा के नाम के लिए है।आशा है कि मदद करता है

List of Language Codes in YAML or JSON?

संबंधित मुद्दे