मेरे पास 9 कॉलम का डेटाफ्रेम है जिसमें कारकों की एक सूची शामिल है। प्रत्येक पंक्ति में सभी 9 कॉलम भर सकते हैं (जैसा कि उस पंक्ति में 9 "चीजें" हो रही हैं), लेकिन अधिकतर नहीं (अधिकांश में 3-4 के बीच होता है)। कॉलम या तो विशिष्ट नहीं हैं, जैसे कि आइटम 200 कॉलम 1 और 3 में दिखाई देता है, यह वही बात है। मैं एक मैट्रिक्स बनाना चाहता हूं जो प्रत्येक पंक्ति के लिए बाइनरी है जिसमें सभी कारक शामिल हैं।प्रति पंक्ति सूची का बाइनरी मैट्रिक्स कैसे बनाएं? (आर)
पूर्व (4 कॉलम के लिए छोटा बस भर में बात पाने के लिए)
R1 3 4 5 8
R2 4 6 7 NA
R3 1 5 NA NA
R4 2 6 8 9
1 2 3 4 5 6 7 8 9
r1 0 0 1 1 1 0 0 1 0
r2 0 0 0 1 0 1 1 0 0
r3 1 0 0 0 1 0 0 0 0
r4 0 1 0 0 0 1 0 1 1
मैं writeBin/readBin, कश्मीर क्लस्टरिंग (देखा है में बदल जाते हैं चाहिए जो मैं कुछ है करना पसंद है, लेकिन मुझे पहले एनएएस से छुटकारा पाना होगा), अस्पष्ट क्लस्टरिंग, टैग क्लस्टरिंग। बस किस दिशा में जाना है इसके बारे में थोड़ी देर खो गई।
मैंने लूप के लिए दो लिखने की कोशिश की है जो मैट्रिक्स से डेटा को स्तंभ/पंक्ति से खींचती है और फिर क्रमशः 0 और 1s को नए मैट्रिक्स में सहेजती है, लेकिन मुझे लगता है कि स्कोप मुद्दे थे।
आप लोग सबसे अच्छे हैं। धन्यवाद!
+1 वह cbind बिट मेरे दिमाग को उड़ाता है। –
जोश, यह प्रभावशाली है। क्या इसके लिए एक शब्द कहा जाता है? मैं इन्वेंट्री मैट्रिक्स, आइटम मैट्रिक्स, या बाइनरी मैट्रिक्स सोच रहा था, लेकिन ये सभी अन्य विचारों से संबंधित प्रतीत होते हैं। –
धन्यवाद। मैं * के बारे में सोचता हूं * नतीजे/अनुपस्थिति मैट्रिक्स के [संकेतक फ़ंक्शन] (http://en.wikipedia.org/wiki/Indicator_function) के बाद परिणाम (यानी संकेतक मैट्रिक्स के बाद) (क्योंकि यह एन्कोड करता है या नहीं प्रत्येक आइटम किसी दिए गए पंक्ति में मौजूद या अनुपस्थित है)। निश्चित नहीं है कि इसके लिए एक स्वीकार्य सामान्य नाम है, हालांकि। –