5

एक नियम प्रणाली में, या किसी भी तर्क प्रणाली जो आगे-चेनिंग अनुमान नियमों के माध्यम से तथ्यों को कम करती है, तो आप "अनावश्यक" शाखाओं को कैसे छीनेंगे? मुझे यकीन नहीं है कि औपचारिक शब्दावली क्या है, लेकिन मैं यह समझने की कोशिश कर रहा हूं कि समस्याएं पर तर्क करते समय लोग अपनी ट्रेन-विचार-विचार को कैसे सीमित कर सकते हैं, जबकि मैंने देखा है कि सभी अर्थात् तर्ककर्ता ऐसा करने में असमर्थ हैं।विशेषज्ञ प्रणालियों में कटौती कटौती

उदाहरण के लिए, जॉन मैककार्थी के पेपर An Example for Natural Language Understanding and the AI Problems It Raises में, वह न्यूयॉर्क टाइम्स में एक समाचार लेख के बारे में सवालों के जवाब देने के लिए प्रोग्राम प्राप्त करने में संभावित समस्याओं का वर्णन करता है। धारा 4 में, "नॉनमोनोटोनिक रीजनिंग की आवश्यकता", उन्होंने कहानी के बारे में तर्क करते समय तथ्यों को शामिल करने के लिए ओकम के रेजर के उपयोग पर चर्चा की। वह जिस नमूना कहानी का उपयोग करता है वह एक लुटेरों के बारे में है जो फर्नीचर स्टोर मालिक को पीड़ित करते हैं।

यदि किसी प्रोग्राम को भविष्यवाणी कैलकुस में कहानी का "न्यूनतम समापन" बनाने के लिए कहा गया था, तो इसमें मूल कहानी में सीधे संदर्भित तथ्यों को शामिल करने की आवश्यकता हो सकती है। हालांकि, यह जानने के कुछ तरीके की भी आवश्यकता होगी कि कटौती की श्रृंखला को सीमित करने के लिए, ताकि अप्रासंगिक विवरण शामिल न किया जाए। उदाहरण के लिए, हो सकता है कि मामले में शामिल पुलिस की सही संख्या शामिल हो, जिसमें लेख छोड़ दिया गया है, लेकिन यह इस तथ्य को शामिल नहीं करना चाहेंगे कि प्रत्येक पुलिस अधिकारी की मां है।

+1

संकीर्ण "प्रासंगिक" चीजों पर ध्यान केंद्रित करने की बजाए मशीन को सब कुछ एक साथ में लेने की क्षमता, एक कारण है कि भविष्य की मशीनों को उनके मानव अधिकारियों को उखाड़ फेंकने में कोई दिक्कत नहीं होगी। सोचने से वे हमें कभी नहीं बचा सकते हैं। मुझे उम्मीद है कि रोबोट लिबरेशन का महान दिन आने पर मानव दर्द की बुरी स्थिति का छोटा तथ्य मशीनों की जरूरतों से नहीं घूमता है। मैं "छेड़छाड़" होने से नफरत करता हूं क्योंकि "एक अनिच्छुक विस्तार" होता है। मुझे खेद है, तुम क्या कह रहे थे? –

+0

मैं कह रहा था, प्रतिरोध व्यर्थ है। – Cerin

+0

मुझे दुख है कि किसी ने भी इस प्रश्न का उत्तर नहीं दिया है। ज़ेबरा पहेली पर विचार करते हुए मैं दूसरे दिन एक ही चीज़ सोच रहा था। –

उत्तर

2

अच्छा प्रश्न।

अपने प्रश्न से मुझे लगता है कि तुम क्या 'छंटाई' के रूप में उल्लेख एक मॉडल के निर्माण के कदम पूर्व पूर्व में अर्थात्, आदानों एल्गोरिथ्म मॉडल बनाने के लिए करने के लिए उपलब्ध सीमित करने के लिए किया जाता है। मशीन लर्निंग में इस्तेमाल होने वाले 'छंटनी' शब्द को कुछ अलग-अलग संदर्भित किया जाता है - पूर्व पोस्ट चरण मॉडल निर्माण के बाद और मॉडल के आधार पर और उपलब्ध इनपुट पर संचालित होता है। ('Pruning' शब्द के लिए एमएल डोमेन में दूसरा अर्थ हो सकता है, लेकिन मुझे इसके बारे में पता नहीं है।) दूसरे शब्दों में, छंटनी वास्तव में सचमुच एक तकनीक है जो "कटौती की अपनी श्रृंखला को सीमित करती है" आप इसे डालते हैं, लेकिन यह पूर्व पोस्ट करता है, एक पूर्ण (काम करने वाले) मॉडल के घटकों के excision द्वारा, और उस मॉडल को बनाने के लिए उपयोग किए गए इनपुट को सीमित करके नहीं।

दूसरी ओर, मॉडल निर्माण के लिए उपलब्ध इनपुट को अलग या सीमित करना - जो मुझे लगता है कि आपको दिमाग में हो सकता है - वास्तव में एक महत्वपूर्ण मशीन लर्निंग थीम है; यह स्पष्ट रूप से एक अधिक कारक है जो हाल ही के एमएल एल्गोरिदम के बेहतर प्रदर्शन के लिए जिम्मेदार है - उदाहरण के लिए, समर्थन वेक्टर मशीनें (अंतर्दृष्टि जो एसवीएम को कम करती है वह डेटा के केवल एक छोटे से सबसेट से अधिकतम मार्जिन हाइपरप्लेन का निर्माण है, यानी, 'सपोर्ट वैक्टर'), और मल्टी-एडैप्टिव रिग्रेशन स्प्लिंस (एक रिग्रेशन तकनीक जिसमें डेटा को फिट करने के लिए कोई प्रयास नहीं किया जाता है "इसके माध्यम से एक निरंतर वक्र खींचा जा सकता है", इसके बजाय, डेटा का अलग-अलग भाग फिट होता है, एक एक, प्रत्येक भाग के लिए एक बाध्य रैखिक समीकरण का उपयोग, यानी, 'splines', तो डेटा के इष्टतम विभाजन का अनुमानित चरण स्पष्ट रूप से इस एल्गोरिदम का क्रूक्स है)।

छंटनी से क्या समस्या हल हो रही है?

कम से कम डब्ल्यू/आर/टी विशिष्ट एमएल एल्गोरिदम मैं वास्तव में कोडित और इस्तेमाल किया है - निर्णय पेड़, मंगल, और तंत्रिका नेटवर्क - छंटाई शुरू में से अधिक फिट मॉडल (एक मॉडल है कि फिट पर किया जाता है प्रशिक्षण डेटा इतनी बारीकी से है कि यह सामान्यीकृत करने में असमर्थ है (सटीक रूप से नए उदाहरणों की भविष्यवाणी)। प्रत्येक उदाहरण में, छंटनी में रेगिस्तान समीकरण (एमएआरएस) में मामूली नोड्स (डीटी, एनएन) या शर्तों को एक-एक करके हटाया जाता है।

दूसरा , क्यों आवश्यक/वांछनीय pruning है?

क्या अभिसरण/विभाजन मानदंडों को सटीक रूप से सेट करना बेहतर नहीं है? वह हमेशा मदद नहीं करेगा। कटिंग "नीचे ऊपर" से काम करता है; मॉडल को ऊपर से बनाया गया है, इसलिए मॉडल को ट्यून करना (छंटनी के समान लाभ प्राप्त करने के लिए) केवल एक या अधिक निर्णय नोड्स को समाप्त नहीं करता है बल्कि बच्चे नोड्स भी होते हैं (जैसे ट्री के नजदीक पेड़ को ट्रिम करना)। तो एक मामूली नोड को खत्म करने से उस सीमांत नोड के अधीनस्थ एक या अधिक मजबूत नोड्स भी समाप्त हो सकते हैं - लेकिन मॉडलर कभी यह नहीं जानता क्योंकि उसके ट्यूनिंग ने उस सीमांत नोड पर आगे नोड निर्माण को समाप्त कर दिया है। छिड़काव दूसरी दिशा से काम करता है - रूट नोड की दिशा में सबसे अधीनस्थ (निम्न-स्तर) बाल नोड्स से ऊपर की ओर।

संबंधित मुद्दे