2016-05-18 13 views
20

मैं ब्राज़ीलियाई सामाजिक-आर्थिक माइक्रोडाटा सेट (जनगणना, पीएनएडी, आदि) आयात करने में सुविधा के लिए एक पैकेज लिख रहा हूं।एक पैकेज में द्विभाषी (अंग्रेजी और पुर्तगाली) दस्तावेज

  • ब्राजील में उपयोगकर्ता, जो पुर्तगाली में प्रलेखन के साथ आराम से अधिक महसूस कर सकते हैं: मैं पैकेज के उपयोगकर्ताओं की दो अलग-अलग समूहों पूर्वानुमान। शायद कुछ हद तक अंग्रेजी को समझ सकते हैं, लेकिन विदेशी भाषा शायद पैकेज को "ergonomic" कम महसूस करेगी।

  • व्यापक अंतर्राष्ट्रीय उपयोगकर्ता समुदाय, जिनसे अंग्रेजी दस्तावेज एक आवश्यक शर्त हो सकती है।

क्या यह संभव है एक तरह से एक पैकेज लिखने के लिए कि प्रलेखन "द्विभाषी" (अंग्रेजी और पुर्तगाली) है, और उपयोगकर्ता को दिखाया भाषा अपने देश/भाषा सेटिंग्स पर निर्भर करेगा?

इसके अलावा,

है कि roxygen2 प्रलेखन ढांचे के भीतर संभव?

मुझे एहसास है कि इसे द्विभाषी बनाम जटिल जटिलता और बनाए रखने में कठिनाई बनाकर पैकेज को अधिक उपयोगकर्ता के अनुकूल बनाने का एक व्यापारिक तरीका है। पिछली समाप्ति से इस व्यापार पर सामान्य टिप्पणियों का भी स्वागत है।

संपादित करें: टिप्पणी के सुझाव के बाद मैंने आर-पैकेज-डेवेल मलिंग सूची को पार किया। HERE, फिर नीचे दिए गए उत्तरों का पालन करें। के लिए अलग

  • एक भाषा में पैकेज है, लेकिन विगनेट्स: डंकन मर्डोक क्या @Brandons का जवाब (bellow) में से कुछ को कवर को शामिल किया गया, लेकिन यह भी दो अतिरिक्त सुझाव मुझे लगता है कि उपयोगी होते हैं सहित एक दिलचस्प उत्तर पोस्ट भाषाओं। मैं इस सलाह का पालन करूंगा।

  • पैकेज के संस्करणों के लिए है, एक- भाषा

+1

यदि आपको यहां उपयोगी उत्तर नहीं मिलते हैं तो यह [r-package-devel] (https: // पर पूछने के लिए एक अच्छा सवाल हो सकता है। stat.ethz.ch/mailman/listinfo/r-package-devel) मेलिंग सूची ... –

+0

@ बेनबॉकर आप सही थे, यहां दिनों के लिए कोई जवाब नहीं है, इसलिए मैंने मलिंग सूची पर पोस्ट किया (ऊपर संपादित देखें)। कुछ घंटों बाद पहले ही एक जवाब है। टीके – LucasMation

+2

महान सवाल।मुझे लगता है कि यह दूसरों को एसओ पर उपलब्ध कराने के लिए फायदेमंद भी होगा, इसलिए यदि आप मेलिंग सूची पर प्राप्त प्रतिक्रिया के आधार पर एक उत्तर इकट्ठा करना चाहते हैं तो यह बहुत अच्छा होगा। –

उत्तर

13
Ropensci के अनुसार

पर 1.1 और 1.2, एक मान लीजिए, वहाँ गैर अंग्रेजी भाषाओं में पैकेज प्रलेखन अनुवाद के लिए कोई मानक तंत्र है । वे internationalization/localization की विशिष्ट प्रक्रिया इस प्रकार का वर्णन:

बनाने के लिए गैर अंग्रेजी प्रलेखन पूरक .Rd फ़ाइलों या पैकेज विगनेट्स की पुस्तिका निर्माण की आवश्यकता है।

संकुल गैर अंग्रेजी प्रलेखन आपूर्ति DESCRIPTION फ़ाइल में एक भाषा क्षेत्र शामिल होना चाहिए।

और Language मैदान पर कुछ और जानकारी:

ए 'भाषा' फ़ील्ड अगर पैकेज दस्तावेज़ अंग्रेज़ी में नहीं है इंगित करने के लिए इस्तेमाल किया जा सकता: यह एक अल्पविराम से अलग किए होना चाहिए मानक (नहीं निजी इस्तेमाल या grandfathered) इसे IETF भाषा टैग की वर्तमान में आरएफसी 5646 (https://tools.ietf.org/html/rfc5646, भी https://en.wikipedia.org/wiki/IETF_language_tag देखें) द्वारा परिभाषित किया गया, के रूप में यानी, भाषा subtags जो सार में हैं का उपयोग 2-अक्षर आईएसओ 639-1 (https://en.wikipedia.org/wiki/ISO_639-1) या 3-अक्षर आईएसओ 639-3 (https://en.wikipedia.org/wiki/ISO_639-3) भाषा कोड।

यदि आपके पैकेज में गैर-ASCII टेक्स्ट है, तो विशेष रूप से यदि यह एक से अधिक लोकेल में उपयोग किया जाना है तो देखभाल की आवश्यकता है। DESCRIPTION फ़ाइल में और आरडी फ़ाइलों में उपयोग किए गए एन्कोडिंग को चिह्नित करना संभव है।

एन्कोडिंग के बारे में

... यदि आप वास्तव में गैर- ASCII पाठ की जरूरत है

पहले, सावधानी से विचार करें। कई आर के उपयोगकर्ता केवल अपने मूल भाषा समूह (जैसे पश्चिमी यूरोपीय, पूर्वी यूरोपीय, सरलीकृत चीनी) और ASCII.72 में सही टेक्स्ट देखने में सक्षम होंगे। अन्य पात्रों को बिल्कुल भी प्रस्तुत नहीं किया जा सकता है, गलत तरीके से प्रस्तुत किया गया है, या आपके आर कोड को त्रुटि देने का कारण बनता है। के लिए आरडी दस्तावेज, एन्कोडिंग को चिह्नित करना और ASCII लिप्यंतरण सहित उचित नौकरी करने की संभावना है। वर्णों का सेट जो सामान्य रूप से समर्थित है, 2000 के आसपास होने के मुकाबले व्यापक है, लेकिन गैर-लैटिन वर्णमाला (ग्रीक, रूसी, जॉर्जियाई, ...) अभी भी समस्याग्रस्त हैं और डबल-चौड़ाई वाले वर्ण वाले (चीनी , जापानी, कोरियाई) को सही ढंग से प्रस्तुत करने के लिए विशेषज्ञ फोंट की आवश्यकता होती है।

एक संबंधित नोट पर, आर , तथापि, "errors and warnings" in different languages के लिए सहायता प्रदान करता है - "R- और सी-स्तर त्रुटि अनुवाद करने के लिए तंत्र और चेतावनी संदेश रहे हैं वहाँ तभी उपलब्ध होता है R है कर रहे हैं। एनएलएस समर्थन के साथ संकलित (जिसे कॉन्फ़िगरेशन विकल्प --enable-nls, डिफ़ॉल्ट द्वारा अनुरोध किया जाता है)। "

3

द्विभाषी दस्तावेज के अलावा, कृपया मुझे निम्नलिखित टिप्पणी दें: अपने दो "लक्ष्य" समूहों को देखते हुए, यह माना जा सकता है कि आपके कुछ उपयोगकर्ता गैर-अंग्रेजी ओएस (आमतौर पर, पुर्तगाली में विंडोज) चला रहे होंगे। अलग-अलग "दिनांक" स्वरूपण (अंग्रेजी बनाम गैर-अंग्रेजी) के कारण समय श्रृंखला डेटा (या तथ्य की बात के रूप में किसी दिनांक प्रविष्टि) को आयात करते समय, आपको अंग्रेजी में आयात करते समय अलग-अलग "परिणाम" (यानि गलत तरीके से प्रविष्टि प्रविष्टियां) मिल सकती हैं/गैर-अंग्रेजी मशीनें। मुझे उन मुद्दों के साथ कुछ अनुभव है (मैं अक्सर चेक-भाषा-आधारित ओएस के साथ काम करता हूं) और विज्ञापन-कोड कोडिंग के अलावा- मुझे एक साधारण समाधान नहीं मिला है। (यदि आपको यह विषय मिल गया है, तो कृपया बेझिझक हटाने के लिए)

संबंधित मुद्दे