में एन्कोडिंग और कच्चे मुझे यकीन नहीं है कि यह एक बग है या नहीं। यदि मैं कच्चे और फिर से परिवर्तित करने से पहले वर्णों में से एक को यूटीएफ -8 में एन्कोड करता हूं, तो वर्ण समान नहीं होते हैं। मैंने RStudio में "यूटीएफ -8" में डिफ़ॉल्ट एन्कोडिंग सेट की है।आर
rawToChar(charToRaw(enc2utf8("vægt")))
[1] "vægt"
rawToChar(charToRaw("vægt"))
[1] "vægt"
यहाँ मेरी sessionInfo()
R version 3.2.2 (2015-08-14)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1
locale:
[1] LC_COLLATE=Danish_Denmark.1252 LC_CTYPE=Danish_Denmark.1252 LC_MONETARY=Danish_Denmark.1252
[4] LC_NUMERIC=C LC_TIME=Danish_Denmark.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] ggthemes_2.2.1 TTR_0.23-0 lubridate_1.3.3 tidyr_0.2.0 skm_1.0.2 ggplot2_1.0.1 dplyr_0.4.3
[8] stringr_1.0.0 dkstat_0.08
loaded via a namespace (and not attached):
[1] Rcpp_0.12.1 rstudioapi_0.3.1 magrittr_1.5 MASS_7.3-43 munsell_0.4.2 lattice_0.20-33
[7] colorspace_1.2-6 R6_2.1.1 httr_1.0.0 plyr_1.8.3 xts_0.9-7 tools_3.2.2
[13] parallel_3.2.2 grid_3.2.2 gtable_0.1.2 DBI_0.3.1 lazyeval_0.1.10 assertthat_0.1
[19] digest_0.6.8 reshape2_1.4.1 curl_0.9.3 memoise_0.2.1 labeling_0.3 stringi_0.5-5
[25] scales_0.3.0 jsonlite_0.9.17 zoo_1.7-12 proto_0.3-10
मेरी विंडोज 10 मशीन पर पुष्टि की लेकिन मेरी लिनक्स मशीन पर ठीक काम करता है। –
मुझे लगता है कि यह एक विंडोज़ केवल मुद्दा है। – KERO
यह एक मुद्दा है जिसे मैं विभिन्न XML पैकेजों का उपयोग करते समय चलाता हूं। क्या कोई यह बता सकता है कि xml संकुल में charToRaw से पहले enc2utf8 की आवश्यकता क्यों है? आप लेखकों की तरफ से बात नहीं कर सकते हैं, लेकिन मैं सिर्फ यह समझना चाहता हूं कि यह क्यों किया गया है और यदि मैं सुझाव दे सकता हूं कि इसके बिना enc2utf8 को हटा दिया गया है तो बहुत सारे नए मुद्दे सामने आते हैं। – KERO