शोर जैविक डेटा की आवधिकता के लिए परीक्षण: periodogram महत्व?

मैं आर में कुछ शोर समय-श्रृंखला डेटा का विश्लेषण करने की कोशिश कर रहा हूं। डेटा जानवरों के सीओ 2 उत्सर्जन पर आधारित है और वे एक प्रकार की चक्रीय आवधिकता दिखाते हैं जिसे मैं विशेषता देना चाहता हूं। मैं अनुमानों का परीक्षण करना चाहता हूं:शोर जैविक डेटा की आवधिकता के लिए परीक्षण: periodogram महत्व?

एच 0: कोई चक्रीय सीओ 2 उत्सर्जन नहीं है (यानी यादृच्छिक से अधिक नहीं)।

एच 1: चक्र या दालों में सीओ 2 उत्सर्जन का एक पैटर्न है।

तो ऐसा करने के लिए मैंने डेटा को आर में आयात किया है, इसे एक समय श्रृंखला वर्ग में परिवर्तित कर दिया है, और इसके आवधिक पत्र की योजना बनाई है।

R periodogram of time series CO2 data

नीचे चित्र में, मैं चार या पांच कुछ हद तक अलग संकेत चोटियों देख सकते हैं:

t25a <- read.table("data.txt", header=TRUE, sep="\t") 
t1 <- ts(t25a$Co2) 
plot(t1) 
spec.pgram(t1, spans=4, log="no")

यहाँ कि, कैसा दिखता कच्चे डेटा शीर्ष पर साजिश रची और periodogram नीचे के साथ है डेटा में आवृत्ति घटक। मेरा सवाल है - क्या वे सभी समान रूप से "महत्वपूर्ण" हैं? क्या यह जांचने का कोई तरीका है कि मनाए गए चोटियों एक दूसरे से या शून्य परिकल्पना की भविष्यवाणियों से काफी अलग हैं या नहीं? मुझे पता है कि कैसे करना है उन चोटियों से जुड़ी आवृत्ति पाएं, लेकिन मुझे यह निर्धारित करने के लिए एक और अधिक उद्देश्य विधि चाहिए कि डेटा में वास्तव में कितने "महत्वपूर्ण" चोट हैं।

स्रोत

2011-10-21 James Waters

आप समझते हैं कि बिजली स्पेक्ट्रम की इकाइयां क्या हैं, हां? [इकाइयों ** 2/हर्ट्ज] आप मूल स्पेक्ट्रम के रूप में एकीकृत स्पेक्ट्रम के बारे में सोच सकते हैं, इसलिए यदि एक चोटी दूसरे की तुलना में बड़ी है, तो उस आवृत्ति पर अन्य ऊर्जा की तुलना में अधिक ऊर्जा (सिग्नल) है। तो "महत्व" वास्तव में एक सार्थक सवाल नहीं है। और आपको वास्तव में एक पतला योजना का उपयोग करना चाहिए, और लॉगरिदमिक आवृत्ति (इस मामले में) की साजिश करना चाहिए। –

@ एंडीबार्बर सबसे पहले, इकाइयां। मेरी समझ यह है कि ऊपर की अवधि पर वाई-अक्ष शक्ति का एक उपाय है और एक्स-अक्ष व्यस्त आवृत्ति है। * 2 आपकी इकाइयों * 2/हर्ट्ज से कहां से आती है? सिग्नल के विभिन्न घटकों के सापेक्ष महत्व के उपाय के रूप में, क्या मैं एक एकीकृत चोटी के अनुपात को कुल क्षेत्र में मान सकता हूं? –

पारसेवल के प्रमेय पर एक नज़र डालें, या इकाइयों को आसानी से प्रदर्शित करने के लिए एक विश्लेषणात्मक कार्य पर फूरियर ट्रांसफॉर्म को काम करें। साजिश पर इकाइयां संभवतया वाई के लिए हैं, डीबी में 1 इकाई ** 2/हर्ट्ज के सापेक्ष, और x, 0 के लिए Nyquist आवृत्ति के लिए। यह निर्भर करता है कि आप किस प्रश्न का उत्तर देना चाहते हैं, लेकिन चोटियों की संभावना डेटा में वास्तविक चक्र हैं (केवल आपके टाइमरीज़ के निरीक्षण से)। –

एक विकल्प आपके शून्य परिकल्पना के तहत डेटा सेट अनुकरण करना होगा (उस आवधिकता की आवश्यकता नहीं है जिसे आप ढूंढ रहे हैं, लेकिन अभी भी अन्य समय श्रृंखला विशेषताओं हैं)। यदि आपके पास संख्यात्मक परीक्षण आंकड़ा है (चोटियों की संख्या, या कुछ अन्य उपाय) तो आप इसे कई अनुरूपित डेटा सेटों के लिए गणना कर सकते हैं और यह आपको नमूना वितरण प्रदान करेगा, बस नमूनाकरण के लिए अपने वास्तविक डेटा के परीक्षण आंकड़ों की तुलना करें वितरण। यदि आप एक सीधे आगे संख्यात्मक परीक्षण आंकड़ा नहीं है, तो फिर तुम एक दृश्य परीक्षण करने पर विचार हो सकता है, देखें:

Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne, 
D.F and Wickham, H. (2009) Statistical Inference for exploratory 
data analysis and model diagnostics Phil. Trans. R. Soc. A 2009 
367, 4361-4383 doi: 10.1098/rsta.2009.0120

आर के लिए TeachingDemos पैकेज में vis.test समारोह इस परीक्षण को लागू करने के साथ मदद करता है (लेकिन अन्य तरीके भी हैं)।

स्रोत

2011-10-21 16:43:47

अरे ग्रेग, मुझे उस संदर्भ को इंगित करने के लिए धन्यवाद! मैंने परीक्षण आंकड़ों के रूप में चोटियों की संख्या का उपयोग करने के बारे में सोचा है, लेकिन मैं एक छोटी सी समस्या में भाग जाता हूं। मैं आंखों से "चोटियों" की गिनती से बचना चाहता हूं, इसलिए मैं डेटा को चिकनी करता हूं (क्यूबिक स्प्लिंस का उपयोग करके) और उसके बाद चिकना डेटा में चोटी को गिनने के लिए आर कोड के निफ्टी बिट को गोल करता हूं। लेकिन वे परिणाम मेरे द्वारा लागू चिकनाई की मात्रा पर निर्भर करते हैं, जो स्वाभाविक रूप से कुछ हद तक व्यक्तिपरक है। मैंने अभी तक यह लेख नहीं पढ़ा है, लेकिन शायद यह इन चिंताओं को संबोधित करेगा। –

लेख एक दृश्य परीक्षण के बारे में बात करता है जो अभी भी आपको आंखों से साजिश को देखने की आवश्यकता है, वास्तविक चोटियों की गणना वैकल्पिक हो सकती है। लेकिन परिणाम देखने पर यह सहज ज्ञान युक्त परीक्षण करता है। –

शोर जैविक डेटा की आवधिकता के लिए परीक्षण: periodogram महत्व?

उत्तर

संबंधित मुद्दे