इस बार मैं अपने प्रश्नों में से पहले किए गए आउटलेटर्स का पता लगाने के तरीके पर सीधा सवाल नहीं पूछूंगा। मैंने इस विषय से संबंधित कुछ पोस्ट पढ़ीं लेकिन मुझे जो चाहिए वह नहीं मिला। मैं मानों का एक सेट जो नीचे दिए गए हैं है:यूनिवर्सेट बाहरी पहचान
y<-c(0.59, 0.61, 0.59, 1.55, 1.33, 3.50, 1.00, 1.22, 2.50, 3.00, 3.79, 3.98, 4.33, 4.45, 4.59, 4.72, 4.82, 4.90, 4.96, 7.92, 5.01, 5.01, 4.94, 5.05, 5.04, 5.03, 5.06, 5.10, 5.04, 5.06, 7.77, 5.07, 5.08, 5.08, 5.12, 5.12, 5.08, 5.17, 5.18)
अब के रूप में शोधकर्ताओं के सबसे का कहना है कि बाहरी का पता लगाने की प्रक्रिया न केवल डेटा पर, लेकिन यह भी संदर्भ पर निर्भर करता। मैंने आर जैसे आउटलायर्स (ग्रब टेस्ट), चरमपंथी, mvoutlier (पीसीओटी विधि) से कई पैकेजों का उपयोग किया है लेकिन उन्हें उपयोग करने का सबसे अच्छा तरीका नहीं मिला। यहां इस मामले में (मेरी आवश्यकताओं के आधार पर), 7.77 (ओब्स नो 31), 7.9 2 (20 पर ऑब्जेक्ट), और 3.50 (ओब्स नो 6) आउटलाइर्स हैं। आउटलायर्स पैकेज के ग्रब परीक्षण का उपयोग करके मैं 7.77 और 7.9 2 को आउटलाइन के रूप में देख सकता हूं लेकिन 3.50 नहीं। मुझे नहीं पता कि मैं यहां अपना डेटा प्लॉट पोस्ट कर सकता हूं या नहीं, लेकिन साजिश या वितरण पर डेटा की प्रवृत्ति को देखने के बाद, अवलोकन संख्या 6 एक बाहरी के रूप में स्पष्ट होगा।
मैं इस डेटा के लिए एक गैर रेखीय मॉडल फिट करने की कोशिश कर रहा हूं लेकिन इन आउटलाइर्स की वजह से, मुझे सबसे अच्छा फिट नहीं मिला (सर्वश्रेष्ठ फिट केवल एकमात्र आवश्यकता नहीं है) और वैसे भी मुझे इन आउटलाइर्स को पहचानने की ज़रूरत है इन आउटलाइजर्स पर एक अलग मॉडल फिट करने के लिए।
मेरा प्रश्न बहुत आसान है। क्या यह संभव है कि मैं कुछ मानक पैकेज के साथ इन 3 आउटलाइजर्स का पता कैसे लगा सकता हूं या इन आउटलाइर्स का पता लगाने में सहायता के लिए मैं अपने गैर रेखीय जेनरेट मॉडल का उपयोग कैसे कर सकता हूं?
सादर
शहजाद
क्या आपने MASS पैकेज में आरएलएम का उपयोग करने के बजाय एक मजबूत रैखिक प्रतिगमन करने के लिए विचार किया है? – tcash21
@ tcash21 हां मैंने इसका इस्तेमाल किया है और यह एक रैखिक प्रतिगमन है। मेरे पास nlrob (मजबूत गैर रेखीय प्रतिगमन) भी है लेकिन जेनरेट मॉडल के साथ उल्लिखित आउटलाइनरों का पता लगाने का कोई तरीका नहीं मिला। – Shahzad