2011-11-18 16 views
6

मैं वर्तमान में ऐतिहासिक आधार तेल की कीमतों से भावी आधार तेल की कीमतों का अनुमान लगाने के लिए एक पालतू परियोजना पर काम कर रहा हूं। डेटा साप्ताहिक है लेकिन कीमतें गायब होने के बीच कुछ अवधि हैं।अनियमित डेटा के साथ समय श्रृंखला मॉडलिंग

मैं पूर्ण डेटा के साथ मॉडलिंग समय श्रृंखला के साथ कुछ हद तक ठीक हूं लेकिन जब अनियमित लोगों की बात आती है, तो मॉडल जो मैंने सीखा है, लागू नहीं हो सकते हैं। क्या मैं एक्सटीएस क्लास का उपयोग करता हूं और सामान्य रूप से आर में एआरआईएमए मॉडल के साथ आगे बढ़ता हूं?

भविष्य की कीमतों की भविष्यवाणी करने के लिए मॉडल बनाने के बाद, मैं शुद्धता में सुधार के लिए कच्चे तेल की कीमत में उतार-चढ़ाव, डीजल लाभ मार्जिन, कार बिक्री, आर्थिक विकास और इतने पर (बहुविकल्पीय?) में कारक बनाना चाहता हूं। क्या कोई इस बारे में कुछ प्रकाश डाल सकता है कि मैं इसे कुशल तरीके से कैसे कर सकता हूं? मेरे दिमाग में, यह एक भूलभुलैया की तरह दिखता है।

संपादित करें: यहाँ बालरहित डाटा: https://docs.google.com/document/d/18pt4ulTpaVWQhVKn9XJHhQjvKwNI9uQystLL4WYinrY/edit

कोडिंग:

Mod.fit<-arima(Y,order =c(3,2,6), method ="ML") 

परिणाम: चेतावनी संदेश: लॉग (s2) में: Nans उत्पादित

इस चेतावनी को प्रभावित करेगा मेरी मॉडल सटीकता?

गायब डेटा के साथ, मैं एसीएफ और पीएसीएफ का उपयोग नहीं कर सकता। क्या मॉडल का चयन करने का कोई बेहतर तरीका है? मैंने इस कोड का उपयोग करते हुए विभिन्न एआरआईएमए मॉडल की तुलना करने के लिए एआईसी (अक्काइक की सूचना मानदंड) का उपयोग किया। हरिमा (3,2,6) ने सबसे छोटा एआईसी दिया।

कोडन:

AIC<-matrix(0,6,6) 
for(p in 0:5) 
for(q in 0:5) 
{ 
mod.fit<-arima(Y,order=c(p,2,q)) 
AIC[p+1,q+1]<-mod.fit$aic 
p 
} 
AIC 

परिणाम:

   [,1]  [,2]  [,3]  [,4]  [,5]  [,6] 
    [1,] 1396.913 1328.481 1327.896 1328.350 1326.057 1325.063 
    [2,] 1343.925 1326.862 1328.321 1328.644 1325.239 1318.282 
    [3,] 1334.642 1328.013 1330.005 1327.304 1326.882 1314.239 
    [4,] 1336.393 1329.954 1324.114 1322.136 1323.567 1316.150 
    [5,] 1319.137 1321.030 1320.575 1321.287 1323.750 1316.815 
    [6,] 1321.135 1322.634 1320.115 1323.670 1325.649 1318.015 
+1

SO में आपका स्वागत है। कुछ डेटा पोस्ट करना हमेशा एक अच्छा विचार है, जैसा कि कोड की कुछ पंक्तियां दिखा रहा है जो आपने पहले ही कोशिश की है। एक अच्छा प्रश्न लिखने के कुछ सुझावों के लिए http://stackoverflow.com/q/5963269/602276 देखें। – Andrie

+0

धन्यवाद एंड्री। मैं आपकी सलाह की सराहना करता हूं। मैं जितनी जल्दी हो सके कोड डाल दूंगा। – leejy

+0

@Andrie मैंने कोडिंग और छंटनी डेटा के साथ प्रश्न अद्यतन किया है। क्या आप इसे देख सकते हैं? धन्यवाद! क्या मैं सही रास्ते पर हूं? – leejy

उत्तर

4

नहीं सामान्य रूप में आप XTS का उपयोग करें और फिर एक ARIMA करने की ज़रूरत नहीं है, वहाँ के लिए आवश्यक एक अतिरिक्त कदम है। NA के रूप में दर्ज किए गए गुम मान arima() द्वारा प्रबंधित किए जाते हैं और यदि method = "ML" का उपयोग करते हैं तो उन्हें ठीक से संभाला जाएगा; अन्य विधियों को अनुपलब्ध डेटा के लिए नवाचार नहीं मिल सकते हैं। यह काम करता है क्योंकि arima() एक राज्य-अंतरिक्ष प्रतिनिधित्व में एआरआईएमए मॉडल फिट बैठता है।

यदि डेटा नियमित है लेकिन डेटा गुम है तो उपर्युक्त ठीक होना चाहिए।

कारण मैं सामान्य उपयोग XTS है में नहीं है का कहना है कि सिर्फ इतना है कि arima() अपने इनपुट के रूप में एक univariate समय श्रृंखला वस्तु ?ts की आवश्यकता है। हालांकि, XTS प्रदान करता है और वस्तुओं और चिड़ियाघर पैकेज करता वर्ग "zoo" की वस्तुओं के लिए एक as.ts() तरीका प्रदान चिड़ियाघर से इनहेरिट करती है। इसलिए यदि आप zoo() या xts() ऑब्जेक्ट में अपना डेटा प्राप्त करते हैं, तो आप "ts" कक्षा में सहभागिता कर सकते हैं और इसमें उचित स्थानों पर NA शामिल होना चाहिए, जो arima() तब संभाल लेगा यदि यह कर सकता है (यानी बहुत सारे गुम मूल्य नहीं हैं) ।

+0

सलाह के लिए धन्यवाद! यह बहुत संक्षिप्त और स्पष्ट है। मैंने 'arima()' का इस्तेमाल किया जैसा आपने कहा था लेकिन यह एक चेतावनी लौटा दी। क्या यह मॉडल को ही प्रभावित करेगा? इसके अलावा, मेरे डेटा के लिए एआरआईएमए मॉडल का चयन करने के अन्य विकल्प क्या हैं क्योंकि एसीएफ और पीएसीएफ काम नहीं कर सकते हैं? – leejy

+0

तो क्यों अलिमा() के साथ xts का उपयोग नहीं करना चाहिए? आपके उत्तर से मैं इकट्ठा करता हूं कि या तो xts या चिड़ियाघर को आवश्यकतानुसार asts() के साथ जोड़ा जा सकता है। –

+0

@NathanGould केवल यही है, जैसा कि मैंने ऊपर बताया है, 'arima() 1 प्राप्त करने के लिए अतिरिक्त कदम शामिल हैं जो इसकी आवश्यकता है। शायद पिछले अनुच्छेद में एक "गायब" की जरूरत है। –

संबंधित मुद्दे