2008-08-16 6 views
8

हमारे पास एक एंटरप्राइज़ वेब एप्लिकेशन है जहां सिस्टम में प्रत्येक पाठ का पाठ उपयोगकर्ता के ब्राउज़र की संस्कृति सेटिंग में स्थानीयकृत होता है।विभिन्न उन्मुखताओं के साथ भाषाओं के साथ काम करने के लिए कोई अच्छा संसाधन या सलाह? (जैसे जापानी या चीनी)

अब तक हमने केवल अंग्रेजी, अमेरिकी (समान लेकिन गलत वर्तनी ;-) और फ्रेंच (कनाडाई गोवेट - ऐप में अंग्रेजी या फ्रेंच में उपयोगकर्ता वरीयता के आधार पर) का समर्थन किया है। विकास के दौरान हमारे पास डच और जर्मन जैसे कुछ यूरोपीय भाषाएं भी थीं जो शब्दों को बहुत लंबे समय तक जोड़ती हैं।

हम वर्तमान में पूर्वी भाषाओं के लिए समर्थन की जांच कर रहे हैं: चीनी, जापानी, और इसी तरह। मैं समझता हूं कि इन्हें ध्वन्यात्मक इनपुट लिखित वर्णों में परिवर्तित किया जाता है। यह वेब पर कैसे काम करता है? इनपुट और टेक्स्टरेस संपादित किए जाने पर एक ही घटनाएं आग लगती हैं (हम काफी अजाक्स भारी हैं)।

इन शीर्ष-डाउन भाषाओं के उपयोगकर्ता ऑनलाइन अपेक्षा करते हैं कि कौन से सम्मेलन ऑनलाइन हैं?

उनके दोहरी इनपुट (फोनेटिक टाइपिंग + रूपांतरण) का वेब नियंत्रण पर क्या प्रभाव पड़ता है?

अरबी जैसे आरटीएल भाषाओं के साथ उपयोगकर्ता पूरे इंटरफ़ेस को प्रतिबिंबित करने की अपेक्षा करते हैं? उदाहरण के लिए, ठीक/रद्द बटन जैसी चीज़ों को स्वैप किया जाना चाहिए और बाईं ओर?

+0

मुझे आपके प्रश्न का उत्तर नहीं पता है, लेकिन यदि आप पहले से नहीं हैं तो आप इसकी समीक्षा करना चाहेंगे: [पूर्ण न्यूनतम सॉफ्टवेयर डेवलपर बिल्कुल, सकारात्मक रूप से यूनिकोड और कैरेक्टर सेट्स के बारे में जानना चाहिए (कोई बहाना नहीं!) ] (http://www.joelonsoftware.com/articles/Unicode.html)। (यदि वह पहले से ही एक क्षेत्र है जिसे आप परिचित हैं, तो बेहतर जवाब पर जाने के लिए स्वतंत्र महसूस करें :)) –

उत्तर

5

माइक्रोसॉफ्ट द्वारा Globalization Step-by-Step पढ़ें।

मैं सीजेकेवी पर विनिर्देशों का उत्तर दे सकता हूं, लेकिन शायद आप इस विषय पर एक पुस्तक चाहते हैं। मैंने इसे नहीं पढ़ा है लेकिन सीजेकेवी सूचना प्रसंस्करण O'Reilly से है (द्वितीय संस्करण दिसंबर, 2008 के कारण)।

मैं समझता हूं कि इन्हें ध्वन्यात्मक इनपुट लिखित वर्णों में परिवर्तित किया जाता है। यह वेब पर कैसे काम करता है?

इनपुट विंडोज़, मैक और लिनक्स (जैसे एससीआईएम) पर IME (Input Method Editor) नामक सॉफ्टवेयर के एक वर्ग द्वारा किया जाता है। जब एक आईएमई चालू होता है, तो कीबोर्ड से इनपुट पहले आईएमई में जाता है, और उपयोगकर्ता को सही कांजी/हिरागाना कॉम्बो चुनना पड़ता है। जब उपयोगकर्ता रिटर्न कुंजी मारकर काम करता है, तो वर्तमान एन्कोडिंग का उपयोग कर वेब ब्राउज़र में आईजीई कांजी/हिरागाना में टाइप करता है। एन्कोडिंग स्थिति एक बड़ी गड़बड़ी थी, लेकिन यदि आप एक वेब ऐप लिख रहे हैं, तो यूनिकोड के एन्कोडिंग के साथ जाएं। मैं यूटीएफ -8 का सुझाव देता हूं।

इनपुट और टेक्स्टरेस संपादित किए जाने पर भी वही घटनाएं आग लगती हैं?

एक यूनिकोड समझदार वेब ब्राउज़र और ओएस कॉम्बो कई भाषाओं को संभालता है। उदाहरण के लिए, कोई जापानी वेबसाइट ब्राउज़ करने और पोस्ट करने के लिए फ़ायरफ़ॉक्स के अंग्रेज़ी सामान्य संस्करण का उपयोग कर सकता है। ब्राउज़र के दृष्टिकोण से, यह यूनिकोड में "ब्लै ब्ला ब्लै" की एक सरणी है। दूसरे शब्दों में, यदि घटना अंग्रेजी में फंस जाती है, तो यदि आप यूनिकोड संस्करण का उपयोग करते हैं तो उसी घटना को सीजेकेवी में आग लगनी चाहिए।

इन शीर्ष-डाउन भाषाओं के उपयोगकर्ता ऑनलाइन अपेक्षा करते हैं कि कौन से सम्मेलन ऑनलाइन हैं?

सीजेकेवी पाठकों को बाएं से दाएं ऑनलाइन की उम्मीद है। गणित और विज्ञान पाठ्यपुस्तक बाएं से दाएं से लिखे गए हैं। वर्ड के स्थानीय संस्करण सहित अधिकांश वर्ड प्रोसेसर, बाएं से दाएं लिखते हैं।

उनके दोहरी इनपुट (फोनेटिक टाइपिंग + रूपांतरण) का वेब नियंत्रण पर क्या प्रभाव पड़ता है?

अधिकांश भाग के लिए आपको इसके बारे में चिंता करने की ज़रूरत नहीं है, जब तक कि आप कीबोर्ड ईवेंट को फँस नहीं लेते। उदाहरण के लिए, मुझे अतिरिक्त कीबोर्ड के समूह के साथ जापानी कीबोर्ड का उपयोग करने से नफरत है। इसलिए, जब मुझे यूएस कीबोर्ड पर कुछ कुंजी पर आईएमई ऑन/ऑफ कमांड असाइन करना होगा। मैं व्यक्तिगत रूप से दाएं-Alt का उपयोग करता हूं। साथ ही, स्पेसबार और एंटर कुंजी का उपयोग रूपांतरण के दौरान किया जाता है, लेकिन यह सुनिश्चित नहीं है कि ये ईवेंट ब्राउज़र पर पास हो जाएं या नहीं।

यदि आप चाहते हैं, तो मैं आपकी वेबसाइट का परीक्षण कर सकता हूं। (मेरा उपयोगकर्ता नाम) @ जीमेल।

8

अरबी स्पीकर के रूप में, जब मैं अरबी वेबसाइटों को देखता हूं, तो मुझे उम्मीद है कि ठीक/रद्द करने जैसी चीजें स्वैप की जाएंगी। अरबी पढ़ते समय, मेरी आंखें दाएं से बाएं पढ़ती हैं। इसलिए, ऐसी परिस्थितियों में जहां आप एक नकारात्मक/निष्क्रिय बटन (रद्द करें, साफ़ करें, नहीं, आदि) से पहले एक सकारात्मक/क्रिया बटन (जैसे ठीक है, सबमिट करें, हां, इत्यादि) को देखने के लिए पाठक बनाना चाहते हैं, तो आप शायद पूर्व को दाईं ओर रखना चाहते हैं।

चेतावनी: जैसा कि यह अजीब लगता है, उपर्युक्त केवल अरबी में बटन टेक्स्ट होने पर ही लागू होता है (मुझे व्यक्तिगत रूप से)। यदि बटन टेक्स्ट अंग्रेजी में है (मिश्रित भाषा वेब पेज में), तो मैं बाईं ओर ठीक बटन देखना पसंद करूंगा।

उम्मीद है कि मदद करता है।

2

पूर्वी एशियाई भाषाओं के लिए दिशात्मकता प्रश्न का उत्तर देना आसान है: वेबसाइटें सामान्य रूप से बाएं से दाएं, ऊपर-से-नीचे हैं।

वास्तव में, सामान्य वेब डिज़ाइन लेआउट सिद्धांत बहुत समान हैं। newspaper की वेबसाइटों पर एक नज़र डालें (नाम ऊपर बाएं, बाईं ओर "होम" के साथ नेविगेशन बार, शीर्ष पर सबसे महत्वपूर्ण के साथ नीचे शीर्षक लिंक) या search engine (मुझे नहीं लगता कि मुझे यह कहने की ज़रूरत है कि कौन सी यूएस साइट आपको उस लेआउट की तुलना करना चाहिए)।

हालांकि, अरबी/हिब्रू/आदि के रूप में सही-से-बाएं भाषा उपयोगकर्ता कुछ संदर्भों (एम्बेडेड अंग्रेजी टुकड़े और इतने पर) में बाएं से दाएं प्रगति की उम्मीद करेंगे, यहां तक ​​कि वेब पर स्थितियां भी हैं, जहां ऊपर से नीचे लेआउट को प्राथमिकता दी जाती है। यह आम तौर पर पाठ लेआउट और वांछित फ़ॉन्ट, या फ्लैश का उपयोग कर एक छवि सहित किया जाता है।

इंटरनेट एक्सप्लोरर ने वास्तव में संस्करण 5.5 के बाद से सीएसएस writing-mode property के साथ टीबी-आरएल लेआउट की पेशकश की है, हालांकि none of the other browsers ने इसे लागू करने पर परेशान किया है (या रूबी, जो युवा दर्शकों के उद्देश्य से साइटों के लिए उपयोगी है)। आईई 5.5 2000 में जारी किया गया था, इसलिए यह आठ साल का समर्थन था, और 2003 में W3C candidate recommendation था लेकिन text layout in CSS still being poked around

टेक्स्ट इनपुट और आईएमई के साथ आपकी चिंताओं के लिए, जब तक कि आप टेक्स्ट स्ट्रिंग्स में कीडाउन घटनाओं द्वारा दिए गए वर्चुअल कुंजियों को मैन्युअल रूप से अनुवाद करने की कोशिश करने की तरह कुछ फर्जी नहीं कर रहे हैं, तो आप समस्याओं में भाग लेने की संभावना नहीं रखते हैं।

कुछ अतिरिक्त मुद्दे हैं जिनका आपने उल्लेख नहीं किया है। लैटिन लिपि के साथ लिखी गई भाषाओं के लिए न्यूनतम आराम से पठनीय फ़ॉन्ट आकार बड़ा है। प्रवाह में जोर देने के लिए बोल्ड और इटालिक आमतौर पर उचित नहीं होते हैं। हान एकीकरण का अर्थ यूनिकोड के साथ काम करते समय विभिन्न सीजेके भाषाओं के लिए सही फोंट निर्दिष्ट करने के बारे में चुनने की आवश्यकता है। आप चीनी के लिए पारंपरिक और सरलीकृत इंटरफेस दोनों प्रदान करना चाह सकते हैं, जो आप उम्मीद कर रहे हैं कि आप किस दर्शक की अपेक्षा कर रहे हैं।

मुझे थोड़ी देर के लिए इन पंक्तियों के साथ एक और व्यापक मार्गदर्शिका लिखने का अर्थ रहा है, अगर आपको अधिक जानकारी की आवश्यकता है तो मुझे लात मारने के लिए स्वतंत्र महसूस करें।

संबंधित मुद्दे