मैं एक तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए जैविक डेटा को पूर्व-प्रक्रिया करने की कोशिश कर रहा हूं और विभिन्न सामान्यीकरण विधियों की व्यापक खोज और दोहराव प्रस्तुतिकरण के बावजूद मैं कोई भी बुद्धिमान नहीं हूं कि किस विधि का उपयोग किया जाना चाहिए। विशेष रूप से मेरे पास कई इनपुट वेरिएबल्स हैं जो सकारात्मक रूप से तिरछे हुए हैं और यह स्थापित करने की कोशिश कर रहे हैं कि कोई सामान्यीकरण विधि है जो सबसे उपयुक्त है।skewed सुविधाओं के लिए सबसे उपयुक्त सामान्यीकरण/परिवर्तन विधि?
मैं भी के बारे में कि क्या इन आदानों की प्रकृति नेटवर्क के प्रदर्शन को प्रभावित करेगा चिंतित था और जैसे (लॉग विशेष रूप से परिवर्तन) डेटा परिवर्तनों के साथ प्रयोग किया है। हालांकि कुछ इनपुट में बहुत से शून्य होते हैं लेकिन छोटे दशमलव मान भी हो सकते हैं और सामान्य रूप से संपर्क करने में विफल होने के परिणामस्वरूप वितरण (x + 1) (या उस मामले के लिए 1 से 0.0000001 तक कोई भी संख्या) से अत्यधिक प्रभावित हो सकता है (या तो अवशेष न्यूनतम मूल्य पर एक तेज चोटी के साथ skewed या bimodal बन जाता है)।
क्या यह तंत्रिका नेटवर्क से संबंधित है? अर्थात। क्या मुझे विशिष्ट डेटा परिवर्तन/सामान्यीकरण विधियों का उपयोग स्क्व्यूड डेटा के लिए खाते में करना चाहिए या क्या मुझे इसे अनदेखा करना चाहिए और सामान्यीकरण विधि चुनना चाहिए और आगे बढ़ना चाहिए?
इस मामले पर कोई सलाह बहुत सराहना की जाएगी!
धन्यवाद!
सामान्यीकरण जांच स्थिति के बारे में, मैंने एमएसवीएमपीएक्स का उपयोग करके कुछ डेटासेट चलाने की कोशिश की और मुझे निम्न आउटपुट मिला: ** डेटा मैट्रिक्स के कॉलम उनके मानक विचलन (> 10) के बीच एक बड़ा अंतर ** दिखाते हैं। ** यह वर्गीकृत के प्रदर्शन को प्रभावित कर सकता है। क्या आप डेटा को सामान्यीकृत करना चाहते हैं ([y]/n)? – soufanom