मानक कुकबुक मशीन सीखने में, हम एक आयताकार मैट्रिक्स पर काम करते हैं; यानी, हमारे सभी डेटा पॉइंट्स में समान संख्या में विशेषताएं हैं। हम उन परिस्थितियों का सामना कैसे करते हैं जिनमें हमारे सभी डेटा बिंदुओं की अलग-अलग विशेषताएं होती हैं? उदाहरण के लिए, यदि हम दृश्य वर्गीकरण करना चाहते हैं, लेकिन हमारी सभी तस्वीरें अलग-अलग आयामों के हैं, या यदि हम भावनात्मक विश्लेषण करना चाहते हैं, लेकिन हमारे सभी वाक्यों में अलग-अलग शब्द हैं, या यदि हम तारकीय वर्गीकरण करना चाहते हैं लेकिन सभी सितारों को अलग-अलग बार देखा गया है, आदिजब इनपुट विभिन्न आकारों के होते हैं तो मशीन सीखने के लिए कैसे करें?
मुझे लगता है कि इन अनियमित आकार के डेटा से नियमित आकार की विशेषताओं को निकालने का सामान्य तरीका होगा। लेकिन मैंने हाल ही में गहरी शिक्षा पर एक वार्ता में भाग लिया जहां स्पीकर ने जोर दिया कि डेटा से हाथ-क्राफ्टिंग सुविधाओं की बजाय, गहरे शिक्षार्थियों को उचित सुविधाएं सीखने में सक्षम हैं। लेकिन हम कैसे उपयोग करते हैं उदा। एक तंत्रिका नेटवर्क अगर इनपुट परत निश्चित आकार का नहीं है?
"सभी सितारों के लिए देखी गई सुविधाओं को लें।" मुझे सही मायने में यकीन नहीं है कि इसका क्या अर्थ है। इस उदाहरण में, हमारे पास समय की एक सूची है कि स्टार मनाया गया है, और उस समय मापा गया परिमाण की एक सूची है। प्रत्येक स्टार के लिए, न केवल अवलोकन के समय अलग होते हैं, लेकिन समय की सूची का आकार भी अलग होता है। तो सभी सितारों के लिए 0 विशेषताएं देखी गई हैं। प्रैक्टिस में, कोई इन अवलोकनों से निकाले गए फीचर सेट का निर्माण करता है। लेकिन एल्गोरिदम अवलोकन से नहीं सीखते हैं, वे कुछ मैन्युअल रूप से इंजीनियर सुविधाओं से सीखते हैं। – rhombidodecahedron
मूल रूप से मैं सोच रहा हूं कि इन कार्यों को किए बिना इन कार्यों को कैसे पूरा किया जाए: बिना किसी शब्दकोश के, छवियों का आकार बदलने के बिना। – rhombidodecahedron
@rhombidodecahedron - मुझे नहीं लगता कि आप कर सकते हैं। आपको कुछ बुनियादी सुविधाओं को निकालने में सक्षम होना चाहिए जो सभी उदाहरणों के लिए मौजूद हैं जिनके साथ काम करना है। – IVlad