मैंने एक निश्चित प्रकार की वस्तुओं को पहचानने के लिए एक डेटासेट तैयार किया है (लगभग 2240 नकारात्मक ऑब्जेक्ट उदाहरण और केवल 9 0 पॉजिटिव ऑब्जेक्ट उदाहरण)। हालांकि, डेटासेट में प्रत्येक ऑब्जेक्ट के लिए 10 विशेषताओं की गणना करने के बाद, अद्वितीय प्रशिक्षण उदाहरणों की संख्या क्रमश: 130 और 30 तक गिर गई।क्या मुझे समान प्रशिक्षण उदाहरणों को रखना/हटाना चाहिए जो विभिन्न वस्तुओं का प्रतिनिधित्व करते हैं?
चूंकि समान प्रशिक्षण उदाहरण वास्तव में विभिन्न वस्तुओं का प्रतिनिधित्व करते हैं, क्या मैं कह सकता हूं कि इस डुप्लिकेशन में प्रासंगिक जानकारी (जैसे ऑब्जेक्ट फीचर मानों का वितरण) है, जो एक तरफ या किसी अन्य तरीके से उपयोगी हो सकता है?
क्या तंत्रिका नेटवर्क सुविधाओं के अलावा अन्य जानकारी प्राप्त करता है? और क्या फीचर वैल्यू वास्तव में समान हैं या बस बहुत समान हैं? – seaotternerd
ए 1: नहीं, यह कोई अन्य जानकारी प्राप्त नहीं करता है। ए 2: फीचर वैल्यू समान हैं। –