2012-03-19 11 views
8

का उपयोग कर एक tsv फ़ाइल पढ़ने के लिए मैं एक विशिष्ट एन्कोडिंग का उपयोग कर एक .tsv (टैब-पृथक मान) फ़ाइल को आर में पढ़ने की कोशिश कर रहा हूं। यह माना जाता है कि windows-1252 है। और इसमें एक हेडर है।आर विशिष्ट एन्कोडिंग

कोड के लिए डेटा फ्रेम में डालने के लिए कोई सुझाव?

उत्तर

19

शायद ऐसा कुछ?

mydf <- read.table('thefile.txt', header=TRUE, sep="\t", fileEncoding="windows-1252") 
str(mydf) 
6

तुम भी उपयोग कर सकते हैं:

read.delim('thefile.txt', header= T, fileEncoding= "windows-1252")

बस अपने अनुसंधान consol में आदेश दर्ज:

> read.delim 
function (file, header = TRUE, sep = "\t", quote = "\"", dec = ".", 
    fill = TRUE, comment.char = "", ...) 
read.table(file = file, header = header, sep = sep, quote = quote, 
    dec = dec, fill = fill, comment.char = comment.char, ...) 

पता चलता है कि read.delim एक पैक read.table आदेश कि पहले से ही के रूप में टैब निर्दिष्ट करता है आपके डेटा का विभाजक। read.delim अधिक सुविधाजनक हो सकता है यदि आप बहुत सारी tsv फ़ाइलों के साथ काम कर रहे हैं।

दो आदेशों के बीच अंतर अधिक जानकारी in this Stack question पर चर्चा की गई है।

2

df <- read.delim(~/file_directory/file_name.tsv, header = TRUE) एकल .tsv फ़ाइल के लिए ठीक काम कर रहा होगा, क्योंकि यह पहले से ही टैब अलग है, इसलिए कोई जरूरत नहीं sep = "\t"fileEncoding= "windows-1252" का उपयोग किया जा सकता है लेकिन आवश्यक नहीं है।

संबंधित मुद्दे