ठीक है, इसलिए मैंने बहुत कुछ खोजा है और बिक्री डेटा पर नियम चलाने के लिए चाहते हैं। मुझे बस सही प्रारूप में डेटा ठीक से प्राप्त करने और सही "कारक" या "चर" और टोकरी के रूप में स्थापित करने की आवश्यकता है।नियमों के लिए टोकरी में लेनदेन डेटा कैसे तैयार करें
अभी मेरे पास ऑर्डर # और उसके बाद के आइटम के साथ बिक्री डेटा है। प्रत्येक आदेश अद्वितीय है (प्रत्येक नया ऑर्डर, एक नया # बनाया जाता है और भाग # शामिल होता है), लेकिन वही आइटम स्पष्ट रूप से कई ऑर्डर में दिखाई दे सकते हैं।
वर्तमान में, अपने डेटा इस तरह की स्थापना की है:
Order# Part# PartDescription
1 A PartA 1 B PartB 1 G PartG 2 R PartR 3 A PartA 3 B PartB 4 E PartE 5 Y PartY 6 A PartA 6 B PartB 6 F PartF 6 V PartV
तो, आर इस रूप में यह पसंद नहीं करता, और मैं के रूप में इसे पाने के लिए है कि arules और डेटा विश्लेषण स्वीकार करेंगे।
हाँ मैं इसे एक टेक्स्ट फ़ाइल के रूप में सहेजता हूं और एक .csv फ़ाइल की कोशिश की है, लेकिन अगर मैं इसे तैयार करने या RStudio में इसे कुशल बनाने के लिए चरण-दर-चरण निर्देश प्राप्त कर सकता हूं तो यह बहुत अच्छा होगा।
मैंने पढ़ा है कि यह इस तरह के रूप में एक टोकरी के रूप में होना लगता है ..
1 (ए, बी, जी)
2 (आर)
3 (ए, बी)
4 (ई)
5 (वाई)
6 (ए, बी, एफ, वी)
अगर वह सही नहीं है तो कृपया मुझे सही करें। मुझे विचार मिलता है लेकिन मुझे बस चरण-दर-चरण निर्देशों की आवश्यकता है जो मुझे कहीं भी नहीं मिल रहा है। मैंने dplyr और tidyr का उपयोग करने की कोशिश की है। मुझे डेटा विश्लेषण की अच्छी समझ है लेकिन मुझे रुस्टूडियो पर अधिक सीधी मदद की ज़रूरत है, इसलिए यदि मैं केवल उस कदम से कदम उठा सकता हूं तो मैं इसे और समझूंगा। आदेश द्वारा
library(arules)
?transactions
अपने प्रकार के लिए, आप split
चाहते हैं, तो करने के लिए as
का उपयोग करें:
मैं भी, डाटा माइनिंग प्लगइन Excel के लिए है, इसलिए अगर मैं क्या कर सकते हैं वहां कोई तैयारी मुझे बताती है। धन्यवाद। – V1k1
मुझे लगता है कि कम से कम डेटा को डेटा.फ्रेम के रूप में लोड किया गया है? यदि नहीं, तो 'डेटा <- read.csv ("myfile.csv", comment.char = "")' – jeremycg
पर क्लिक करें, मैंने बस "आयात डेटासेट" पर क्लिक किया है और नीचे दी गई प्रतिक्रिया मेरे डेटा को सही टोकरी प्रारूप में डाल रही है। क्या मुझे इसे और समस्याओं से बचने के लिए डेटा.फ्रेम के रूप में लोड करने की ज़रूरत है? मैं इसे आर में कैसे सही तरीके से लोड करना चाहिए? यह एक्सेल से एक टेक्स्ट फ़ाइल है, क्या यह .csv होना चाहिए? मेरे पिता सही कॉलम/पंक्तियों में प्रकट होते हैं।मुझे किन आयात सेटिंग्स का चयन करना चाहिए? धन्यवाद! – V1k1