2014-12-11 8 views
5

मैं उपयोगकर्ता व्यवहार प्रोजेक्ट काम कर रहा हूं। उपयोगकर्ता इंटरैक्शन के आधार पर मुझे कुछ डेटा मिला है। अच्छा अनुक्रम है जो उस समय सुचारू रूप से बढ़ता और घटता है। लेकिन वहां कुछ विसंगतियां हैं, जो बहुत बुरी हैं। नीचे ग्राफ को देखें:संख्याओं के अनुक्रम को सामान्य कैसे करें?

Plotted sequence

तुम भी डेटा यहाँ पा सकते हैं:

2,0789 2,09604 2,11472 2,13414 2,15609 2,17776 2,2021 2,22722 2,25019 2,27304 2,29724 2,31991 2,34285 2,36569 2,38682 2,40634 2,42068 2,43947 2,45099 2,46564 2,48385 2,49747 2,49031 2,51458 2,5149 2,52632 2,54689 2,56077 2,57821 2,57877 2,59104 2,57625 2,55987 2,5694 2,56244 2,56599 2,54696 2,52479 2,50345 2,48306 2,50934 2,4512 2,43586 2,40664 2,38721 2,3816 2,36415 2,33408 2,31225 2,28801 2,26583 2,24054 2,2135 2,19678 2,16366 2,13945 2,11102 2,08389 2,05533 2,02899 2,00373 1,9752 1,94862 1,91982 1,89125 1,86307 1,83539 1,80641 1,77946 1 .75333 1,72765 1,70417 1,68106 1,65971 1,64032 1,62386 1,6034 1,5829 1,56022 1,54167 1,53141 1,52329 1,51128 1,52125 1,51127 1,50753 1,51494 1,51777 1,55563 1,56948 1,57866 1,60095 1,61939 1,64399 1,67643 1,70784 1,74259 1,7815 1,81939 1,84942 1,87731 1,89895 1,91676 1,92987

मैं इस दृश्य चमकीला बनाना चाहते हैं। तकनीक एक्स और वाई की विशेषता वाले संख्याओं को खत्म करने में सक्षम होना चाहिए, यानी मोनो-बढ़ती या मोनो-कमी में त्रुटि।

तो समाप्त नहीं, तकनीक उन्हें शिफ्ट करने के लिए इतना है कि श्रृंखला त्रुटियों से प्रभावित नहीं है सक्षम होना चाहिए।

मैं क्या करने की कोशिश की और विफल रहे हैं:

  1. मैं मूल्यों के बीच अंतर का परीक्षण करने की कोशिश की। कुछ विशेष मामलों में यह काम करता है, लेकिन इसमें वर्णित अनुक्रम के लिए संख्याओं के बीच की दूरी ऐसी नहीं है कि मैं त्रुटियों को काट सकता हूं

  2. मैंने काउंटर लगाने की कोशिश की, जो कुछ एक्स है, फिर केवल परिवर्तन स्वीकार किया जाता है अन्यथा बिंदु केवल पिछले बिंदु पर मैप किया गया है। यहां मुझे एक्स के मूल्य पर निर्णय लेने में बड़ी समस्या है, क्योंकि यह उपयोगकर्ता-इंटरैक्शन पर आधारित है, मैं वास्तव में इसका नियंत्रक नहीं हूं। यदि उपयोगकर्ता इंटरैक्शन ऐसा है कि इसकी साजिश एक ज़िगज़ैग पैटर्न होगी, तो मैं 'सभी उपयोगकर्ता स्तर पर मौजूद किसी भी उपयोगकर्ता आंदोलन डेटा' के साथ समाप्त हो रहा हूं।

तकनीक है कि आप के बारे में पता कर रहे हैं साझा करें।

पुनश्च: डाटा इस उदाहरण में उपलब्ध कराया गया एक विशेष विषय है। कोई विशिष्ट पैटर्न नहीं है जिसमें संख्याएं होने जा रही हैं, लेकिन हम उम्मीद करते हैं कि कुछ श्रेणियां सभी उदाहरणों के साथ निरंतर रहेंगी। समाधान जो मैं चाहता हूं वह सामान्य है।

+0

कुछ हद तक मूल्यों पर एक मूर्खतापूर्ण चिकनाई के साथ क्या गलत/गलत हो सकता है? – JBL

+0

मुझे लगता है कि आप कम पास फ़िल्टरिंग या चलने वाली औसत विधि का मतलब है। कम पास फ़िल्टरिंग के साथ मैं आवृत्ति पर निर्णय लेने में सक्षम नहीं हूं, इसलिए फिर से त्रुटियों को काटने में सक्षम नहीं है। चलने के मतलब के साथ, एक्स और वाई प्रकार की त्रुटियां दूर हो जाती हैं, लेकिन चक्रग्रस्त क्षेत्र चलने वाले अर्थों को बुरी तरह प्रभावित कर रहा है, इसलिए वहां बहुत सारी त्रुटियां हैं। – Adorn

+1

शीर्षक में "सामान्यीकृत" शब्द का क्या अर्थ है? –

उत्तर

1

चूंकि आप कट ऑफ आवृत्ति पर निर्णय नहीं ले सकते हैं, और फ़िल्टर पर भी नहीं, जिसे आप उपयोग करना चाहते हैं, मैं कई लागू करता हूं, और उपयोगकर्ता को पैरामीटर सेट करने देता हूं।

पहली बात यह है कि मैं के बारे में सोचा running average है, और आप वहाँ स्थापित करने के लिए, विभिन्न आउटपुट प्राप्त करने के लिए बहुत सी बातें हैं कि देख सकते हैं।

1

मुझे नहीं पता कि आप इस समस्या में कितना प्रयास करना चाहते हैं, लेकिन यदि आप सैद्धांतिक गारंटी चाहते हैं, तो स्थलीय दृढ़ता आपकी समस्या इम्हो के अनुकूल है। मूल रूप से उस विधि के साथ, आप स्केल स्केल करके स्थानीय अधिकतम/न्यूनतम फ़िल्टर कर सकते हैं और ऐसे सिद्धांतिक सबूत हैं जो कहते हैं कि यदि आप नमूनाकरण अपने फ़ंक्शन से बंद करते हैं, तो आप दृढ़ता के साथ अधिकतम संख्याओं को निकालते हैं। विधि के बारे में जानने के लिए आप इन slides (मुख्य रूप से पृष्ठ को देखने के लिए पृष्ठ 9 9) देख सकते हैं।

असल में, यदि आप अपने अंक को परिदृश्य के रूप में लेते हैं और अधिकतम ऊंचाई और घटने से शुरू होने वाले वाटरशेड की कल्पना करते हैं, तो आपके पास कुछ चुनौतियां हैं। प्रत्येक पिक में ऐसा समय होता है जहां यह पैदा होता है, वह वह समय होता है जहां यह उभरा होता है और वह समय जहां मर जाता है, जब यह एक उच्च पिक के साथ विलीन हो जाता है। अब एक दृढ़ता चित्र प्रत्येक पिक के लिए एक बिंदु चित्रित करता है जहां इसका एक्स/वाई निर्देशांक जन्म/मृत्यु का समय होता है (मान लीजिए कि पहला पिक मर नहीं जाता है और दिखाया नहीं जाता है)। यदि कोई पिक वैश्विक अधिकतम है, तो यह स्थानीय अधिकतम पिक की तुलना में दृढ़ता आरेख में विकर्ण से आगे होगा। स्थानीय maximums को हटाने के लिए आप विकर्ण के करीब चुनने के लिए है। चौके अपने उदाहरण में स्थानीय अधिकतम कर रहे हैं के रूप में आप अपने डेटा के हठ आरेख के साथ देख सकते हैं (डेटा btw प्रदान करने के लिए धन्यवाद) और दो वैश्विक लोगों (पहली पसंद एक हठ चित्र में चित्र नहीं है): Persistence diagram of your function

आप शोर की तरह अपने डेटा हैं: enter image description here

आप अभी भी एक बहुत ही सभ्य हठ आरेख जिसे आप फ़िल्टर करना स्थानीय अधिकतम अनुमति देगा मिल जाएगा आप चाहते हैं:

enter image description here

पी पट्टा पूछें कि क्या आप अधिक जानकारी या संदर्भ चाहते हैं।

+0

मुझे देरी से जवाब के लिए खेद है। मैंने अभी तक आपके समाधान की कोशिश नहीं की है। लेकिन यह अच्छा लगता है। जैसे ही मैं कोशिश करता हूं परिणाम के बारे में यहां अपडेट करूँगा – Adorn

संबंधित मुद्दे