के आधार पर डेटा निकालने मैं एक बहुत बड़ा डेटा अलग अलग आबादी से genotypic जानकारी के साथ निर्धारित किया है। मैं जनसंख्या से डेटा को सॉर्ट करना चाहता हूं, लेकिन मुझे नहीं पता कि कैसे।सबसेट डेटा/पहले 7 पत्र
मैं "pedigree_dhl" के आधार पर सॉर्ट करना चाहते हैं। मैं निम्नलिखित कोड का उपयोग कर रहा था, लेकिन मुझे त्रुटि संदेश मिलते रहे।
newdata <- project[pedigree_dhl == CCB133$*1, ]
मेरे समस्या भी है, कि 'वंशावली-डीएचएल' व्यक्तिगत जीनोटाइप के सभी नाम शामिल हैं। कॉलम 'वंशावली-डीएचएल' कॉलम में केवल पहले 7 अक्षर आबादी का नाम हैं। इस उदाहरण में: सीसीबी 133। मैं आर को कैसे बता सकता हूं, कि मैं सभी कॉलम के लिए डेटा निकालना चाहता हूं, जिसमें सीसीबी 133 है?
Allele1 Allele2 SNP_name gs_entry pedigree_dhl
1 T T ZM011407_0151 656 CCB133$*1
2 T T ZM009374_0354 656 CCB133$*1
3 C C ZM003499_0591 656 CCB133$*1
4 A A ZM003898_0594 656 CCB133$*1
5 C C ZM004887_0313 656 CCB133$*1
6 G G ZM000583_1096 656 CCB133$*1
'substr' आप एक चरित्र वेक्टर के सबस्ट्रिंग निकालने के लिए अनुमति देता है। आप यह सुनिश्चित करना चाहते हैं कि आपका कॉलम वास्तव में एक वर्ण वेक्टर है और 'substr' का उपयोग करने से पहले एक कारक नहीं है या आपको कुछ अप्रत्याशित परिणाम मिल सकते हैं। सबसेटिंग के लिए, 'आर सबसेट' के लिए SO खोजें और आपको कई जवाब मिलेंगे। 'सबसेट()' फ़ंक्शन स्वयं इंटरैक्टिव सत्र के लिए काफी उपयोगी है, जबकि '[' ऑपरेटर का उपयोग कुछ स्थितियों में किया जाता है। – Chase