2012-11-24 28 views
9

enter image description hereगतिशील रूप से गीज़ यूनिकोड उत्पन्न करना

हाय। यदि आप उपरोक्त छवि को देखते हैं, तो आप कुछ लैटिन वर्णों के साथ प्रदर्शित बहुत अजीब दिखने वाले वर्णों का एक सेट देखेंगे। अजीब लोग एरिट्रिया पात्र हैं। वे वे पात्र हैं जिनका हम अपने देश में उपयोग करते हैं। तो, इस बिंदु पर स्ट्रेट जाने के लिए, मैं उम्मीद कर रहा हूं कि सॉफ़्टवेयर का सबसे सरल संभव बिट या यहां तक ​​कि एक बैच फ़ाइल (यदि संभव हो) भी बनाने के लिए मैं इन पात्रों को वेब पर लागू करने में मदद करता हूं और पीसी को समझता हूं और उन्हें प्रदर्शित करता हूं आपके द्वारा लिखा गया। अरबी, हिंदू, चीनी की तरह ... पात्रों का उपयोग किया जाता है। मुझे लगता है, चूंकि 'भाषा बनाने' का सवाल अक्सर दुर्लभ होता है या क्योंकि मुझे उपयोग करने के लिए सही शब्द नहीं पता हो सकता है, जब मैंने किसी ट्यूटोरियल या यहां तक ​​कि एक फ्रीलांसर या कुछ भी खोजने के लिए इंटरनेट की खोज की, तो मुझे बस मिला ... कुछ भी तो नहीं। तो, मैं उम्मीद कर रहा हूं, अगर कोई मुझे चरण-दर-चरण मार्गदर्शिका दे सकता है, या यहां तक ​​कि केवल इसे बनाने के बारे में एक सुराग भी बहुत उपयोगी होगा।

धन्यवाद।

+2

ऐसा लगता है कि उन सभी पात्रों को यूनिकोड में परिभाषित किया गया है। http://en.wikipedia.org/wiki/Tigrinya_language आपको इन्हें वेब सामग्री (यूटीएफ -8 एन्कोडिंग के साथ) में शामिल करने में सक्षम होना चाहिए या आप 'ቘ' के लिए ቘ जैसे HTML इकाइयों का उपयोग कर सकते हैं। – ddoxey

+2

क्या इन वर्णों में इथियोपिक पात्रों ([यूनिकोड कोड चार्ट्स से डाउनलोड करने योग्य] (http://www.unicode.org/charts/) से डाउनलोड करने योग्य है), श्रेणी U + 1200..U + 137C में कोड के साथ, यू + 1380..यू + 13 99, यू + 2 डी 80..यू + 2 डीडीई, और यू + एबी 00..यू + एबी 2 ई? यदि नहीं, तो आपको कम से कम निजी उपयोग की जाने वाली वर्ण श्रेणियों (यू + ई000..यू + एफ 8 एफएफ, या यू + एफ 0000..यू + 10 एफएफएफएफ) का उपयोग करने की आवश्यकता है, कम से कम जब तक आपको एरिट्रिया वर्णों को पहचाना न जाए यूनिकोड द्वारा। –

+0

@ddoxey - मैंने हमेशा सोचा है कि पात्रों को किसी भी पीसी में प्रदर्शित करने के लिए कुछ सॉफ़्टवेयर प्रोग्राम की आवश्यकता है, अन्यथा आप वर्ण नहीं देख सकते हैं। लेकिन, ऐसा लगता है कि मैं गलत था, क्योंकि यदि आप अपने पीसी में '& # 4696' देख सकते हैं, तो इसका मतलब है कि वे सॉफ़्टवेयर इंस्टॉल किए बिना सभी ब्राउज़रों में देख-योग्य हैं। मैं कभी नहीं जानता था कि अब तक यूनिकोड क्या परिभाषित किया गया है। क्या इसका मतलब है कि मैं अपनी साइट पर एक स्क्रिप्ट बना सकता हूं जो छोटी छवियों को एचटीएमएल कोड में बदलता है और अक्षर पोस्ट करता है ..? यदि ऐसा है, तो यह एक जीवन बचत विचार होगा। – samayo

उत्तर

26

आपका प्रश्न "भाषा कैसे बनाएं" पूछता है, इसलिए मैं एक नई भाषा (या अधिक सटीक, लेखन प्रणाली) के लिए होने वाले सभी टुकड़ों का वर्णन करूंगा। आप विशेष रूप से एरिट्रिया वर्णमाला के बारे में पूछते हैं, इसलिए मैं आधुनिक प्रणालियों पर इसका समर्थन करने के विशिष्ट उदाहरण प्रदान करूंगा, और आप जो टुकड़े खो रहे हैं, उनके लिए पॉइंटर्स प्रदान करने का प्रयास करेंगे। उत्तर लंबा है, और दो स्पष्टीकरणों का समर्थन करने के लिए बहुत सारे लिंक प्रदान करता है।

Ge'ez (जिसे इथियोपिक भी कहा जाता है) के साथ काम करने के लिए, इरिप्रिया में इथियोपिया और टिग्रीनिया में अम्हारिक लिखने के लिए उपयोग की जाने वाली स्क्रिप्ट) आपको कुछ चीजों की आवश्यकता है। पहला पात्रों को एन्कोड करने का एक तरीका है; प्रत्येक चरित्र का प्रतिनिधित्व करने वाले संख्याओं का एक सेट, जो कंप्यूटर पाठ का प्रतिनिधित्व करने के लिए उपयोग कर सकता है। सौभाग्य से, Unicode व्यापक हो गया है, और यूनिकोड को एक सार्वभौमिक चरित्र सेट के रूप में डिजाइन किया गया है जिसमें सभी दुनिया की भाषाएं शामिल हैं। यूनिकोड 3.0 ने range U+1200-U+137F में इथियोपिक पेश किया, और बाद के संस्करणों ने U+1380-U+1394, U+2D80-U+2DDF और U+AB00-U+AB2F श्रेणियों में अधिक अस्पष्ट पात्रों की खुराक को जोड़ा। यदि आप एक ऐसी भाषा का समर्थन करना चाहते हैं जो यूनिकोड ने अभी तक समर्थन नहीं किया है, तो आपको या तो private use area का उपयोग करने की आवश्यकता होगी और कोड स्क्रिप्ट पर वर्णों के अपने मैपिंग को परिभाषित करना होगा, या submit a proposal अपनी स्क्रिप्ट को यूनिकोड में जोड़ा जाएगा; उदाहरण के लिए, Ethiopic के लिए प्रस्ताव देखें।

अब, यूनिकोड सिर्फ character set है; पात्रों और संख्याओं के बीच एक सार मैपिंग। वास्तव में बाइट्स के अनुक्रम के रूप में इन वर्णों को प्रेषित करने के लिए, आप character encoding का उपयोग करते हैं। कई एन्कोडिंग हैं; उनमें से कुछ, जैसे ASCII और ISO-8859-1 केवल पूर्ण यूनिकोड चरित्र सेट का सबसेट कवर करते हैं, जबकि अन्य UTF-8 और UTF-16, पूर्ण सीमा को कवर करते हैं। वेब पर दस्तावेज़ों के लिए, यूटीएफ -8 अनुशंसित वर्ण एन्कोडिंग है; यदि आप इसकी मदद कर सकते हैं तो आपको किसी और चीज का कभी भी उपयोग नहीं करना चाहिए। यूटीएफ -8 में, आप दस्तावेज़ में सीधे गीज़ लिख सकते हैं, उदाहरण के लिए: ኤርትራ। एक बात यह देखने के लिए है कि कुछ प्रोग्राम (विशेष रूप से विंडोज़ पर) आपको "यूनिकोड" एन्कोडिंग के रूप में पेश करेंगे, जब उनका मतलब यूटीएफ -16 होगा; आप यूटीएफ -8 चुनना सुनिश्चित करना चाहते हैं, क्योंकि यह अधिक कुशल और सॉफ़्टवेयर की विस्तृत विविधता के साथ अधिक संगत है।

यदि आप एन्कोडिंग का उपयोग कर रहे हैं जो यूनिकोड की पूरी श्रृंखला को कवर नहीं करते हैं, या आपके पास उन वर्णों को टाइप करने का कोई अच्छा तरीका नहीं है, और आप HTML या XML लिख रहे हैं, तो आप इसके बजाय numeric character references का उपयोग कर सकते हैं। ऐसा करने के लिए, आप उस चरित्र के यूनिकोड कोड बिंदु को लिखते हैं जिसे आप &# और ; के बीच संदर्भित करना चाहते हैं। आप दशमलव में संख्या, या हेक्साडेसिमल में x के साथ उपसर्ग कर सकते हैं।उदाहरण के लिए, & # x1200; ሀ या ሀ लिखा जा सकता है (अंत में अर्धविराम महत्वपूर्ण है; यह टिप्पणियों में आपके लिए काम नहीं कर रहा था क्योंकि आप इसे याद कर रहे थे)।

अब आपके पास एक चरित्र सेट है, और इसे एन्कोड करने का एक तरीका है, आपको इसे प्रदर्शित करने का एक तरीका चाहिए। कुछ स्क्रिप्ट दूसरों में प्रदर्शित करना आसान है। सभी स्क्रिप्ट के लिए, आपको की आवश्यकता है; एक फाइल परिभाषित करती है कि प्रत्येक चरित्र कैसा दिखता है। एक फ़ॉन्ट में ग्लिफ का संग्रह होता है, या प्रत्येक चरित्र के चित्र होते हैं। कुछ स्क्रिप्ट, जैसे Latin alphabet (अंग्रेजी और अधिकांश यूरोपीय भाषाओं के लिए उपयोग किए गए वर्णमाला) अपेक्षाकृत सरल हैं; प्रत्येक चरित्र एक अलग ग्लिफ होता है, और वे कैसे खींचे जाते हैं यह इस बात पर निर्भर नहीं करता कि कौन से पात्र पहले या बाद में आते हैं (हालांकि diacritics और ligatures इसे थोड़ा और जटिल बना सकते हैं)। अन्य, जैसे Arabic और Indic scripts कर्सीव में लिखे गए हैं, जहां पत्र एक दूसरे से जुड़ते हैं ताकि वे कैसे खींचे जाते हैं, उनके पास के पात्रों पर निर्भर हो सकते हैं। इन भाषाओं को Uniscribe या DirectWrite पर लिनक्स पर Pango या Apple Advanced Typography या Graphite जैसे उन्नत फ़ॉन्ट तकनीक जैसे विशेष प्रतिपादन समर्थन की आवश्यकता होती है।

सौभाग्य से, गीज़ एक काफी सरल लेखन प्रणाली है, जिसके लिए किसी विशेष प्रतिपादन समर्थन या उन्नत फ़ॉन्ट सिस्टम की आवश्यकता नहीं होती है। प्रत्येक पात्र एक अलग ग्लिफ है, और इसे किसी भी पुनरावृत्ति की आवश्यकता नहीं है। तो सामान्य कंप्यूटर पर पहले से उपलब्ध रेंडरिंग सिस्टम के साथ प्रदर्शित एक सामान्य OpenType फ़ॉन्ट, नौकरी करेगा। लेकिन पात्रों को प्रदर्शित करने में सक्षम होने के लिए आपको अभी भी फ़ॉन्ट की आवश्यकता है। अपना खुद का फ़ॉन्ट बनाने के लिए, आप FontForge (एक फ्री/ओपन सोर्स टूल), Fontographer, FontLab Studio, या अन्य समान सॉफ़्टवेयर का उपयोग कर सकते हैं।

इथियोपिक के लिए, आपको अपना खुद का निर्माण करने की आवश्यकता नहीं है। numerous fonts available हैं जिनमें इथियोपिक वर्ण शामिल हैं, लेकिन एक जिसे मैं अनुशंसा करता हूं SIL (भाषाविज्ञान ग्रीष्मकालीन संस्थान) से Abyssinica SIL है, जो अल्पसंख्यक भाषाओं और लेखन प्रणालियों के लिए बहुत अच्छा काम करता है। उनके फ़ॉन्ट free license के तहत उपलब्ध हैं, जो आपको फ़ॉन्ट का उपयोग करने, फ़ॉन्ट को पुनर्वितरित करने और फ़ॉन्ट को संशोधित करने की अनुमति देता है, इसलिए उनके फ़ॉन्ट काफी लचीले होते हैं और इन्हें विभिन्न प्रकार की स्थितियों में उपयोग किया जा सकता है। विंडोज़ जहाजों Nyala के साथ, जिसमें इथियोपिक पात्र शामिल हैं, क्योंकि विंडोज विस्टा, और Ebrima, जो विंडोज 8 में इथियोपिक पात्रों के लिए समर्थन जोड़ा गया; इसलिए विंडोज विस्टा या बाद में लोग पहले से ही इथियोपिक पात्रों को देखने में सक्षम होना चाहिए। Kefa as of 10.6 के साथ मैक ओएस एक्स जहाज।

एक बार आपके पास फ़ॉन्ट हो जाने के बाद, आप इथियोपिक वर्ण देख पाएंगे। लेकिन आपके दस्तावेज़ों को पढ़ने वाले अन्य लोगों में उन फोंट नहीं हो सकते हैं (यदि वे विंडोज़ या मैक ओएस एक्स के पुराने संस्करण का उपयोग कर रहे हैं, अगर उन्होंने विंडोज के साथ आने वाले सभी फ़ॉन्ट्स इंस्टॉल नहीं किए हैं), इस मामले में पात्र शायद उनकी मशीन पर बक्से या प्रश्न चिह्न के रूप में दिखाई देंगे। आप उन लोगों को एबीसिनिका एसआईएल जैसे पुनर्वितरण योग्य फ़ॉन्ट दे सकते हैं, या वे एक फ़ॉन्ट खरीद सकते हैं जिसमें इथियोपिक पात्र शामिल हैं, लेकिन यह असुविधाजनक हो सकता है। वर्ड प्रोसेसर दस्तावेज़ या सादा पाठ के साथ काम करने के लिए, शायद यह संभव है कि आप कर सकें; पाठ को प्रदर्शित करने में सक्षम होने के लिए उन्हें अपने कंप्यूटर पर स्थापित फ़ॉन्ट की आवश्यकता होगी। यदि आप अपने कंप्यूटर पर एक पीडीएफ बनाते हैं, तो उसे फ़ॉन्ट को एम्बेड करना होगा जिसे इसे टेक्स्ट प्रदर्शित करने की आवश्यकता है, इसलिए पीडीएफ बनाना आपके दस्तावेज़ के साथ असामान्य फ़ॉन्ट्स को शामिल करने का एक सुविधाजनक तरीका हो सकता है।

किसी वेब पेज पर, आप अपने स्टाइलशीट से फ़ॉन्ट से लिंक करने के लिए web fonts का उपयोग कर सकते हैं, जिससे उपयोगकर्ता वेब ब्राउजर उस वेब पेज के लिए उस फ़ॉन्ट को लोड कर सकता है। वेब फोंट all the way back to IE 6 समर्थित हैं, और अधिकांश अन्य वेब ब्राउज़र के हाल के संस्करणों में, इसलिए वे वास्तव में काफी व्यापक रूप से समर्थित हैं।विभिन्न वेब ब्राउज़र विभिन्न फ़ॉन्ट फ़ाइल प्रारूपों का समर्थन करते हैं (EOT, TTF, OpenType, SVG, और WOFF), और सीएसएस के लिए थोड़ा अलग वाक्यविन्यास (IE के पुराने संस्करण पुराने ड्राफ्ट पर आधारित हैं), इसलिए यह थोड़ा मुश्किल हो सकता है एक पृष्ठ जो सभी ब्राउज़रों के साथ संगत है। सौभाग्य से, लोगों ने उस प्रक्रिया को स्वचालित कर दिया है। कुछ वेब फोंट Google Web Fonts या FontSquirrel से ऑनलाइन उपलब्ध हैं, लेकिन दुख की बात है, मुझे पहले से होस्ट किए गए किसी भी इथियोपिक फोंट नहीं मिल पाए। हालांकि, आप upload a font to FontSquirrel कर सकते हैं, और यह इसे सभी प्रमुख प्रारूपों में परिवर्तित कर देगा, और उदाहरण सीएसएस प्रदान करेगा जो सभी आधुनिक ब्राउज़रों पर काम करेगा। ध्यान दें कि आपको केवल उन फ़ॉन्ट्स के साथ ऐसा करना चाहिए जो वेब एम्बेडिंग की अनुमति देते हैं; सभी फोंट नहीं करते हैं। चूंकि एबीसिनिका एसआईएल ओपन फ़ॉन्ट लाइसेंस के तहत उपलब्ध है, इसलिए आप इसका उपयोग कर सकते हैं, और मैंने इसे आपके लिए FontSquirrel के माध्यम से चलाया है; आप see how it works (ग्लाइफ & भाषा टैब देखें), या download the kit देख सकते हैं। इसका इस्तेमाल करने के लिए, बस अपने सीएसएस रूप में एक ही निर्देशिका में अपने सर्वर पर फ़ॉन्ट फ़ाइलें (.ttf, .eot, .svg, और .woff) रखा, और शामिल अपने सीएसएस में निम्नलिखित:

@font-face { 
    font-family: 'abyssinica_silregular'; 
    src: url('abyssinicasil-r.eot'); 
    src: url('abyssinicasil-r.eot?#iefix') format('embedded-opentype'), 
     url('abyssinicasil-r.woff') format('woff'), 
     url('abyssinicasil-r.ttf') format('truetype'), 
     url('abyssinicasil-r.svg#abyssinica_silregular') format('svg'); 
    font-weight: normal; 
    font-style: normal; 
} 

अब जब कि तुम जानते हैं कि कैसे इथियोपिक को एन्कोड करने के लिए, इथियोपिक पात्रों को देखें, और इथियोपिक पात्रों वाले दस्तावेज़ साझा करें, आप शायद उन्हें दस्तावेज़ों में टाइप करना चाहते हैं। यदि आप HTML का उपयोग कर रहे हैं, तो आप ऊपर वर्णित संख्यात्मक वर्ण संदर्भ टाइप कर सकते हैं। अन्य दस्तावेजों में, आप विकिपीडिया पेज की तरह, उन सभी के चार्ट से पात्रों को कॉपी और पेस्ट कर सकते हैं। लेकिन वह बहुत बोझिल हो जाएगा। आपके सिस्टम और सेटिंग्स के आधार पर, आप मनमाने ढंग से यूनिकोड वर्णों को दर्ज करने के लिए Unicode Hex Input का भी उपयोग कर सकते हैं, लेकिन यह भी बोझिल है।

अपने कंप्यूटर पर एक स्क्रिप्ट टाइप करने का पूरी तरह से समर्थन करने के लिए, आपको keyboard layout या input method की आवश्यकता है। कुछ स्क्रिप्ट को एक साधारण कीबोर्ड लेआउट के साथ टाइप किया जा सकता है, जो कहता है कि कौन सी कुंजी किस पात्र से मेल खाती है। यदि कीबोर्ड पर कुंजी की तुलना में किसी स्क्रिप्ट में अधिक वर्ण हैं, तो शिफ्ट और Alt (या मैक पर विकल्प) का उपयोग अधिक वर्णों के लिए मैप करने के लिए किया जा सकता है। आपके द्वारा टाइप किए गए वर्णों की सीमा का विस्तार करने के लिए Dead keys का भी उपयोग किया जा सकता है; मृत कुंजी दो या दो से अधिक कीस्ट्रोक के अनुक्रम होते हैं जो एकल ग्लाइफ उत्पन्न करते हैं; उदाहरण के लिए, मैक ओएस एक्स पर, "á" टाइप करने के लिए, आप विकल्प-ई टाइप कर सकते हैं। विंडोज पर कीबोर्ड लेआउट बनाने के लिए, आप Microsoft Keyboard Layout Creator का उपयोग कर सकते हैं। मैक ओएस एक्स कीबोर्ड लेआउट के लिए an XML format का उपयोग करता है, ताकि आप सीधे एक बना सकें, या एक और आसानी से बनाने के लिए एसआईएल से Ukelele का उपयोग कर सकें। एक्स 11 (लिनक्स की तरह) का उपयोग कर सिस्टम पर, आप create your own XKB layouts कर सकते हैं।

यदि आपको चीनी या जापानी टाइप करने जैसे संशोधक और मृत कुंजी के साथ समर्थित किया जा सकता है, तो आपको अधिक वर्णों की आवश्यकता है, तो आपको एक पूर्ण इनपुट विधि की आवश्यकता है। एक इनपुट विधि आपको उस वस्तु को टाइप करने के लिए मनमाने ढंग से कोड चलाने की अनुमति देती है जो किसी व्यक्ति द्वारा उत्पादित पाठ में टाइप करती है; उदाहरण के लिए, एक जापानी इनपुट विधि में, आप जो भी लिख रहे हैं उसका एक ध्वन्यात्मक प्रतिनिधित्व टाइप कर सकते हैं, और यह आपको उस संभावित मिलान की एक ड्रॉप डाउन सूची दिखाएगा जो उस प्रस्तुति से मेल खाता है, जिससे आप उचित विकल्प चुन सकते हैं। विंडोज इनपुट इनपुट विधियों, मैक ओएस एक्स Input Method Kit लिखने के लिए Input Method Manager प्रदान करता है, और एक्स 11 में ऐसा करने के कुछ तरीके हैं, जैसे SCIM और iBus

इथियोपिक के लिए standard input method मृत कुंजी का व्यापक उपयोग करता है। ऐसा लगता है कि इथियोपिक Keyman के लिए सबसे लोकप्रिय मौजूदा इनपुट विधि है, जो एक वाणिज्यिक इनपुट विधि है जो मैक और विंडोज पर काम करती है, और इसके अलावा एक मुफ्त संस्करण है, KMFL, जो लिनक्स पर काम करता है। इस इनपुट विधि के लिए एसआईएल में keyboard downloads है; उनके पास मैक ओएस एक्स के लिए एक कीबोर्ड लेआउट भी है जो एक ही चीज़ को प्राप्त करने के लिए मृत कुंजी का उपयोग करता है।मैक ओएस एक्स में अधिक विस्तृत मृत कुंजी समर्थन है, इसलिए इनपुट के इस रूप का समर्थन करने के लिए इसे इनपुट विधि की आवश्यकता नहीं है, जबकि विंडोज़ पर आपको इनपुट इनपुट विधि का उपयोग करने की आवश्यकता है जैसे कुंजीमैन इनपुट में प्रवेश करने में सक्षम हो। Google के पास विंडोज, Google Input Tools for Windows के लिए एक नि: शुल्क इनपुट विधि है, जो अम्हारिक का समर्थन करता है, और आपको customize its input schemes पर अनुमति देता है; आप टिग्रीनिया के लिए अपने अम्हारिक समर्थन को अपनाने का प्रयास कर सकते हैं।

यदि आपको किसी वेबसाइट पर इनपुट का समर्थन करने की आवश्यकता है, तो आप इसे जावास्क्रिप्ट में एक इनपुट विधि लिखकर जावास्क्रिप्ट में कर सकते हैं जो किसी व्यक्ति को इथियोपिक में टाइप करता है। मुझे ऐसा करने के लिए किसी भी मौजूदा ढांचे के बारे में पता नहीं है; हालांकि, मुझे Korean और Japanese जावास्क्रिप्ट में लागू इनपुट विधियां मिली हैं। आप देख सकते हैं कि उन्हें कैसे लागू किया जाता है। आगे देखने पर, मैंने पाया है कि टावल्टसॉफ्ट, जो किमैन बनाते हैं, में KeymanWeb भी है, एक जावास्क्रिप्ट आधारित इनपुट विधि जिसे आप अपनी साइट में खरीद और एम्बेड कर सकते हैं। मीडियाविकि में एक इनपुट विधि एक्सटेंशन Narayam भी है, जिसमें विकिपीडिया जैसी मीडियाविकि आधारित साइटों के लिए जावास्क्रिप्ट आधारित इनपुट विधि शामिल है, जिसमें एक प्रयोगात्मक अम्हारिक इनपुट विधि शामिल है। draft W3C IME API भी है, जो वेब ऐप्स और देशी आईएमई के साथ-साथ जावास्क्रिप्ट आधारित आईएमई के बीच इंटरफ़ेस प्रदान करने में सहायता करता है। यह देखते हुए कि यह अभी भी एक मसौदा है, मुझे नहीं पता कि यह अभी तक कहीं भी समर्थित है या नहीं।

उपर्युक्त सभी (एक चरित्र सेट, एन्कोडिंग, फ़ॉन्ट्स, प्रतिपादन समर्थन, और एक इनपुट विधि) के साथ, आप अपनी स्क्रिप्ट में दस्तावेज़ बनाने, साझा करने और देखने में सक्षम होंगे। यदि आपको बस इतना ही चाहिए, तो बढ़िया; उपर्युक्त आपको किसी दिए गए स्क्रिप्ट में दस्तावेज़ों के साथ काम करने की अनुमति देगा। लेकिन आपके कंप्यूटर पर किसी भाषा के लिए पूर्ण समर्थन के लिए, न केवल इसकी स्क्रिप्ट या लेखन प्रणाली, आपको दो और टुकड़े हैं जो आपको चाहिए: locale, और आपके सॉफ़्टवेयर को आपकी भाषा के लिए स्थानीयकृत (अनुवादित और अनुकूलित) किया जाना चाहिए।

एक लोकेल निर्दिष्ट करता है कि किसी दिए गए स्क्रिप्ट, भाषा, संस्कृति, और/या एन्कोडिंग में प्रोग्राम को कैसे छेड़छाड़ की जानी चाहिए। कार्यक्रमों में कई आम पाठ प्रसंस्करण संचालन होते हैं: संख्याएं प्रदर्शित करना, तिथियां और समय प्रदर्शित करना, तारों या नामों को सॉर्ट करना आदि। कार्यक्रम का उपयोग कर व्यक्ति की भाषा, लिपि और संस्कृति के आधार पर इन्हें कैसे काम करना चाहिए; उदाहरण के लिए, स्वीडिश "ü" में "y" के साथ क्रमबद्ध किया गया है, जबकि अंग्रेजी और जर्मन में इसे "यू" के साथ क्रमबद्ध किया गया है। मतभेद भाषा पर आधारित नहीं हो सकते हैं: मेक्सिको और स्पेन दोनों स्पेनिश का उपयोग करते हैं, लेकिन मेक्सिको संख्या में . के साथ दशमलव विभाजक (1½ लिखा गया है "1.5) के रूप में प्रदर्शित किया जाता है, जबकि स्पेन में , दशमलव विभाजक के रूप में उपयोग किया जाता है (1½ लिखा गया है "1,5")। एक लोकेल इन सभी नियमों को निर्दिष्ट करता है। चूंकि लोकेल भाषा, संस्कृति और कभी-कभी अन्य कारकों के आधार पर भिन्न हो सकती है, इसलिए भाषा और देश आमतौर पर लोकेल निर्दिष्ट करने के लिए उपयोग किया जाता है, और अन्य जानकारी का भी उपयोग किया जा सकता है।

स्थानीय नामकरण के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला मानक RFC 4646 (BCP 47) है। यूएस अंग्रेज़ी है en-US, ब्रिटिश अंग्रेजी है en-ब्रिटेन, और फ्रांस में फ्रांसीसी है fr-एफआर: - " सीसी ln" भाषा कोड ln और देश कोड सीसी साथ स्थानों आमतौर पर के रूप में निर्दिष्ट कर रहे हैं । यदि अधिक जानकारी निर्दिष्ट करने की आवश्यकता है, तो इसे शामिल किया जा सकता है। उदाहरण के लिए, Serbian या तो लैटिन या Cyrillic के साथ लिखा जा सकता है, और सर्बिया में सर्बियाई या तो एसआर-लैट-सीएस या एसआर-सीआरएल-सीएस हो सकता है। एरिट्रिया में टिग्रीनिया टीआई-ईआर लिखा गया है।

किसी विशेष लोकेल के नियमों को परिभाषित करने के लिए विभिन्न प्रारूप हैं। विंडोज एनएलपी फाइलों का उपयोग करता है, एक कस्टम प्रारूप जिसे Microsoft Locale Builder के साथ बनाया जा सकता है। POSIX (यूनिक्स/लिनक्स) लोकेशंस localedef का उपयोग करके बनाया जा सकता है। इन दिनों कई प्रणालियां Unicode Common Locale Data Registry की तरफ बढ़ रही हैं, जो लोकेल डेटा के लिए एक मानक प्रारूप के साथ-साथ दुनिया की कई भाषाओं के लिए स्थानीय लोगों का एक व्यापक डेटाबेस निर्दिष्ट करती है।ICU यूनिकोड नियमों और लोकेल डेटा के अनुसार यूनिकोड टेक्स्ट में हेरफेर करने के लिए सी और जावा (और कई अन्य वातावरणों द्वारा उपयोग किया जाता है) के लिए एक लाइब्रेरी है; उनके पास सीएलडीआर और उनके अपने लोकेल डेटा के डेटा के लिए browser अच्छा है। उदाहरण के लिए, ti-ER के लिए अपनी प्रविष्टि पर नज़र डालें।

आखिरकार, किसी भाषा के पूर्ण समर्थन के लिए, आपको उस भाषा में स्वयं सॉफ्टवेयर का अनुवाद करने की आवश्यकता है। निश्चित रूप से, सॉफ्टवेयर के कई टुकड़े हैं, और प्रत्येक में कई तार होते हैं जिन्हें अनुवादित करने की आवश्यकता होती है। कुछ सॉफ़्टवेयर का अनुवाद करने के लिए डिज़ाइन नहीं किया गया है; यह internationalized नहीं रहा है। कुछ सॉफ़्टवेयर का अनुवाद केवल किसी भी व्यक्ति द्वारा किया जा सकता है; तारों को कार्यक्रम में बनाया गया है और किसी तीसरे पक्ष द्वारा आसानी से संशोधित नहीं किया जा सकता है। लेकिन कुछ सॉफ्टवेयर को स्थानीयकृत करना संभव है, इसे अपनी भाषा और संस्कृति में अनुवाद करना। यदि सॉफ़्टवेयर को कई अन्य भाषाओं और संस्कृतियों के लिए पहले ही स्थानांतरित किया गया है, तो यह एक नई भाषा का समर्थन करने के लिए पर्याप्त लचीला होने की संभावना है, और यदि यह उन प्रारूपों का उपयोग करता है जो स्थानीयकरण जानकारी के लिए आसानी से संशोधित हैं, तो इसे तीसरे पक्ष द्वारा संशोधित किया जा सकता है।

उदाहरण के लिए, मैक ओएस एक्स पर एप्लिकेशन एप्लिकेशन स्थानीय बंडल के भीतर अलग-अलग फ़ाइलों में अपने स्थानीयकरण डेटा को स्टोर करते हैं। AppleGlot नामक एक उपकरण है (आपको Mac Developer Program के लिए पंजीकरण करने की आवश्यकता है और इसे खोजने के लिए डाउनलोड क्षेत्र पर जाएं) जो आपको उस डेटा को निकालने में मदद कर सकता है, उन सभी तारों के साथ एक फ़ाइल प्रदान कर सकता है, जिन्हें अनुवादित करने की आवश्यकता है, और आपको अनुमति देता है एक बार आपके पास फिर से आवेदन के साथ गठबंधन करें। ओपन सोर्स सॉफ्टवेयर के लिए, जैसे कि लिनक्स पर उपलब्ध अधिक सॉफ्टवेयर, आप अनुवाद प्रदान करने के लिए डेवलपर्स के साथ काम कर सकते हैं। कुछ सॉफ़्टवेयर अनुवाद स्ट्रिंग्स के लिए gettext का उपयोग करते हैं, जो पीओ फ़ाइल प्रारूप का उपयोग करते हैं जिसे आप poedit का उपयोग करके संपादित कर सकते हैं। कुछ Qt का उपयोग करते हैं, जिसके लिए आप Qt Linguist का उपयोग कर सकते हैं। या विभिन्न प्रकार के प्रारूपों से निपटने के लिए, आप वाणिज्यिक पेशकश जैसे Swordfish या Transifex का उपयोग कर सकते हैं।

बेशक, कोई भी व्यक्ति ऊपर दिए गए सभी को नहीं कर सकता है; आधुनिक कंप्यूटर सिस्टम पर एक नई भाषा के लिए समर्थन बनाने के लिए कई लोगों को मिलकर काम करना पड़ता है। यह सब उन सभी घटकों का उच्च स्तरीय दौरा बनना है जो किसी दिए गए भाषा के लिए भाषा समर्थन में जाते हैं, संदर्भों के साथ जो आप जिस भी पहलुओं पर काम करना चाहते हैं, उसका पालन करने में मदद करेंगे, साथ ही यह दिखाएंगे कि पहले से क्या है टिग्रीनिया और गीज़ स्क्रिप्ट के लिए काम करता है।

+0

मैं बस सोने जा रहा हूं, लेकिन यह पहली बात है जिसे मैं पढ़ूंगा जब मैं कल उठता हूं, मुझे लगता है कि यह 'उत्तरों का जवाब' है, मुझे यकीन है कि यह मैं जितना चाहता हूं उससे ज्यादा है, आप पर्याप्त धन्यवाद नहीं दे सकते। मैं इसे टॉमोरो की जांच करूंगा, क्योंकि मैं थक गया हूं और अब कुछ भी समझ नहीं पा रहा हूं। – samayo

+2

@Eritrea मदद करने के लिए खुशी हुई, सुबह में इसे पढ़ने में शुभकामनाएं, अगर आपके कोई प्रश्न हैं तो मुझे बताएं। –

+0

यह सिर्फ शानदार है !! –

3

यदि वे यूनिकोड वर्ण हैं तो उन्हें किसी अन्य भाषा के पात्रों की तरह प्रदर्शित किया जाना चाहिए। मैं इसे googled और इस पाया, उम्मीद है कि वे एक ही हैं जिन्हें आप के बारे में पूछ रहे हैं कर रहे हैं:

የ ዩ ዪ ያ ዬ ይ ዮ

ዸ ዺ ዻ ዼ ዽ ዾ

देखते हैं? वेब ब्राउज़र या अन्य कार्यक्रमों पर उन्हें प्रदर्शित करने के लिए कोई अतिरिक्त काम आवश्यक नहीं है।


ये यूनिकोड इथियोपिक सेट से चरित्र (U + 1200..U + 137C), UTF-8 में एन्कोड:

पंक्ति 1:

  • የ = 0xE1 0x8B 0xA8 = U + 12E8 = इथियोपिक शब्दांश YA
  • ዩ = 0xE1 0x8B 0xA9 = U + 12E9 = इथियोपिक शब्दांश यू
  • ዪ = 0xE1 0x8B 0xAA = U + 12EA = इथियोपिक शब्दांश यी
  • ያ = 0xE1 0x8B 0xAB = U + 12EB = इथियोपिक शब्दांश YAA
  • ዬ = 0xE1 0x8B 0xAC = U + 12EC = इथियोपिक शब्दांश वाजपेयी
  • ይ = 0xE1 0x8B 0xAD = U + 12ED = इथियोपिक शब्दांश YE
  • ዮ = 0xE1 0x8B 0xAE = U + 12EE = इथियोपिक शब्दांश यो

पंक्ति 2:

  • ዸ = 0xE1 0x8B 0xB8 = U + 12F8 = इथियोपिक शब्दांश डीडीए
  • ዺ = 0xE1 0x8B 0xBA = U + 12FA = इथियोपिक शब्दांश DDI
  • ዻ = 0xE1 0x8B 0xBB = U + 12FB = इथियोपिक शब्दांश DDAA
  • ዼ = 0xE1 0x8B 0xBC = U + 12FC = इथियोपिक शब्दांश DDEE
  • ዽ = 0xE1 0x8B 0xBD = U + 12FD = इथियोपिक शब्दांश डीडीई
  • ዾ = 0xE1 0x8B 0xBE = U + 12FE = इथियोपिक शब्दांश डीडीओ
+0

उत्तर के लिए धन्यवाद, लेकिन अगर वे किसी अन्य चरित्र की तरह प्रदर्शित होते हैं, तो हम अन्य को डाउनलोड और इंस्टॉल करने के लिए बाध्य क्यों हैं ग्रंथों को देखने के लिए सॉफ़्टवेयर/एप्लिकेशन दिखाई देते हैं? क्योंकि, मैं आपको बता सकता हूं कि क्या मैं अपने पीसी से फोंट को हटाना चाहता था, मैं उन्हें – samayo

+0

देख नहीं पाएगा, मैंने अपने पीसी पर कोई फोंट इंस्टॉल नहीं किया है और मैं उन्हें कोई समस्या नहीं देख सकता।आप किस ऑपरेटिंग सिस्टम और वेब ब्राउज़र (+ संस्करण) का उपयोग कर रहे हैं? – user1610015

+0

मेरे पास विंडोज 7+ गूगल क्रोम है। आम तौर पर, प्रत्येक व्यक्ति इन वर्णों को देखने और विशेष रूप से पढ़ने के लिए तृतीय पक्ष द्वारा प्रदान किए गए सॉफ़्टवेयर इंस्टॉल करता है। यह सॉफ़्टवेयर सटीक होना चाहिए: http://www.tavultesoft.com/keyman/download.php मुझे नहीं पता कि वास्तव में क्या चल रहा है, लेकिन मैं http: //freetyping.geezedit जैसी साइट बनाने की कोशिश कर रहा हूं। कॉम/यहां तक ​​कि यह फ़्लैश द्वारा बनाई गई है, मैं जावास्क्रिप्ट और Jquery के साथ एक बनाना चाहता हूँ। क्या आप जानते हैं कि ऐसा करने वाले लोगों को कहां ढूंढना/किराए पर लेना है? – samayo

4

वेब पन्नों पर इथियोपिया वर्णों का उपयोग करना ज्यादातर फोंट की बात इन दिनों है।(आपको आसानी से इन्हें दर्ज करने में भी समस्या हो सकती है, लेकिन यह आपके संलेखन पर्यावरण पर निर्भर करता है जैसे कि विंडोज 7 में कम से कम एक फ़ॉन्ट होता है, लेकिन पुराने कंप्यूटरों में आमतौर पर ऐसे फोंट की कमी होती है। निम्नलिखित फ़ॉन्ट्स में उन्हें शामिल किया जाता है (अन्य भी हो सकते हैं) :

Code 2000, फ्रीवेयर था, लेखक गायब हो गया है, तो स्थिति अस्पष्ट है

Unifont, एक नि: शुल्क बिटमैप फ़ॉन्ट

FreeSerif, एक नि: शुल्क फ़ॉन्ट

Nyala, वितरित वाई विंडोज

SunExt-A, एक नि: शुल्क फ़ॉन्ट

Fixedsys Excelsior, मुझे लगता है एक नि: शुल्क बिटमैप फ़ॉन्ट के कुछ संस्करणों th (परीक्षण नहीं किया)

मैं शायद, एक डाउनलोड फ़ॉन्ट के रूप में FreeSerif का प्रयोग करेंगे @font-face साथ।

1

आप शायद http://senamirmir.org/

जो जब तक मैं गलत किया है हूँ कि आप क्या करना चाहते हैं को देखने के लिए चाहते हैं। यदि आप अपने फ़ॉन्ट्स को पसंद नहीं करते हैं तो एसआईएल एबीसिनिका भी ठीक होना चाहिए (लेकिन इसमें केवल एक लेखन शैली भी शामिल है)। गूगल अब के लिए webfonts प्रदान करता है:

लेआउट स्थिति को लक्षित करने के * सिस्टम की तरह nix आप एक लेआउट http://www.freedesktop.org/wiki/Software/XKeyboardConfig/

2

में विलय कर दिया बस एक ही समस्या करवाते आ गया लेकिन वहाँ एक आसान उपाय है की जरूरत है व्यवस्था करने के लिए सिस्टम से अलग अलग होंगे, कई भाषाओं भी इथियोपिक: http://www.google.com/fonts/earlyaccess

2

अम्हारिक् या वेब प्रपत्रों आप बस किसी भी कुंजी फ़ायरफ़ॉक्स https://addons.mozilla.org/en-US/firefox/addon/any-key/ पर जोड़ने का उपयोग कर सकते में Tigrigna लिखने के लिए और वहाँ क्रोम के लिए भी है !!

लेकिन जावास्क्रिप्ट का उपयोग करके एक संपादक बनाने के लिए आप यहां http://www.lexilogos.com/keyboard/amharic.htm पर एक साइट देख सकते हैं और इसे कैसे कार्यान्वित कर सकते हैं इसे बाहर निकालने का प्रयास करें !!

संबंधित मुद्दे