2010-11-18 18 views
5

तो विचार यह है कि एक कंप्यूटर एजेंट दो परतों, सचेत और बेहोश में प्रोग्राम किया जाएगा।आप कंप्यूटर को "प्राकृतिक आवश्यकता" कैसे दे सकते हैं?

बेहोश हिस्सा अनिवार्य रूप से इनपुट और आउटपुट डिवाइस का एक सेट है, जिसे मैं आम तौर पर सेंसर (कीबोर्ड, तापमान इत्यादि) की कल्पना के रूप में सोचता हूं और आउटपुट विधियों (स्क्रीन और स्पीकर विशेष रूप से मामले में एक होम पीसी, लेकिन फिर से आपकी कल्पना की सीमा तक)। सेंसर को किसी भी समय जोड़ा या हटाया जा सकता है, और यह परत सचेत परत, एक इनपुट और एकल आउटपुट के लिए दो मुख्य चैनल प्रदान करती है। यह परिभाषित करना कि इन दो परतों के बीच किस प्रकार की जानकारी यात्रा करती है, यह मुश्किल है, लेकिन बुनियादी विचार यह है कि जागरूक भाग लगातार बेहोश भाग के उत्पादन से सिग्नल (अमूर्तता के विभिन्न स्तरों) प्राप्त कर रहा है, और सचेत हिस्सा जो कुछ भी भेज सकता है यह इनपुट चैनल के माध्यम से बेहोश परत के लिए नीचे चाहता है।

चेतना परत शुरू में कुछ भी नहीं जानता है, यह बेहोशी परत से इनपुट द्वारा पूरी तरह से नष्ट हो रहा है, और यह जानता है कि सिग्नल वापस कैसे भेजना है, हालांकि यह किसी भी विशेष सिग्नल को बेहोशी वाले हिस्से को कैसे प्रभावित करेगा इस बारे में कुछ नहीं जानता है। सचेत भाग में भंडारण स्थान और प्रसंस्करण शक्ति की एक बड़ी मात्रा है, हालांकि, यह सभी अस्थिर स्मृति है।

अब प्रश्न के लिए। मैं सिस्टम के सचेत हिस्से को "बढ़ने" के लिए चाहूंगा क्योंकि इसमें कोई जानकारी नहीं है कि यह क्या कर सकता है, यह सिर्फ जानता है कि यह सिग्नल भेज सकता है, और इसलिए यह पाइप के नीचे सिग्नल भेजकर शुरू होता है और यह देखता है कि यह कैसे प्रभावित करता है सेंसर डेटा यह वापस प्राप्त करता है। मृत अंत यह है कि कंप्यूटर शुरू में एक लक्ष्य को पूरा करने की कोशिश नहीं कर रहा है। यह सिर्फ सिग्नल भेज रहा है। बच्चे के पैदा होने की तरह सोचने के लिए, उन्हें भोजन की आवश्यकता होती है, या सोते हैं या सूरज से बाहर निकलते हैं, आदि। बच्चे के संवेदी इनपुट को उसके दिमाग में खिलाया जाता है, जो उसके आउटपुट का उपयोग करने का प्रयास करने का फैसला करता है इसे प्राप्त करने के लिए आदेश।

कंप्यूटर की किस तरह की प्राकृतिक आवश्यकता हो सकती है?

What have I tried?
कैसे एक बच्चे को भूख लगी हो जाता है के बारे में विशेष रूप से सोच रही थी, मैं निश्चित रूप से स्कैन भूखे बच्चों या कुछ भी रो रही है पर प्रदर्शन बिल्ली पर किसी भी शोध नहीं पढ़ा है, लेकिन मैंने सोचा कि शायद किसी खास संकेत बढ़ रही गति के साथ बेहोश से आता है लगातार जो केवल तब तृप्त होता है जब सिग्नल वापस भेजे जाते हैं, बच्चे को खाने का कारण बनता है। सचेत मस्तिष्क का काम उस दर को कम करना होगा जिस पर प्रत्येक प्रकार का सिग्नल आता है। दूसरे शब्दों में, कंप्यूटर का "वृत्ति" आने वाले प्रत्येक सिग्नल की दर को सीमित करना है। अन्य "प्रवृत्तियों" क्या हो सकते हैं? पाठ्यक्रम के इस समानता के साथ समस्या यह है कि कंप्यूटर को खाने की जरूरत नहीं है। या कम से कम मैं कंप्यूटर की ज़रूरतों को खाने के लिए अनुवाद करने में सक्षम नहीं हूं।

Outside of the scope of this question
इस का अंतिम लक्ष्य है जो कि यह कैसे टिक टीएसी को पैर की अंगुली खेलने के लिए दुनिया के साथ सूचना का आदान प्रदान को छोड़कर कुछ भी नहीं जानता एक कंप्यूटर सिखाना है। तो मेरे पास एक और विचार था जो एक बटन प्रदान करना था जिसे आप किसी विशेष सिग्नल की दर को मैन्युअल रूप से उत्तेजित करने के लिए दबा सकते हैं जब यह कुछ बुरा करता है या जब यह अच्छा होता है तो किसी विशेष सिग्नल की दर को मैन्युअल रूप से शांत करता है।

+0

कूल विचार, मुझे यह पसंद है।यादृच्छिक विचार हालांकि: जब एआई की बात आती है कि 'प्रकृति ऐसा करती है' तो थोड़ा नतीजा है, अगर आपको लगता है कि कंप्यूटर को "चाहिए"/"ज़रूरत है" (मुझे लगता है कि इस संदर्भ में कहना सुरक्षित है बहुत कुछ वही बात जब तक कि सचेत ने उन्हें अलग करना सीखा नहीं) कुछ, फिर कंप्यूटर को 'चाहते/जरूरत' बनाते हैं। आखिरकार आप केवल तभी देखभाल करते हैं जब यह काम करता है या नहीं। – Crisfole

+0

मैं प्रकृति के बारे में इतना चिंतित नहीं हूं क्योंकि कंप्यूटर के लिए एक लक्ष्य खोजना जो कभी खत्म नहीं होता है, और कंप्यूटर को चीजों को करने के लिए मजबूर करता है ताकि कोने के आसपास आने वाली अपरिहार्य "आवश्यकता" को आसानी से तृप्त किया जा सके। मैं मूल रूप से बेहोश परत में कुछ ढूंढ रहा हूं जो इस व्यवहार को मजबूर करने के लिए नियमित रूप से प्रभावित होगा। मैं सिस्टम को यह बताना नहीं चाहता कि क्या करना है, मैं यह जानना चाहता हूं कि इसे सबसे प्रभावी तरीके से क्या प्राप्त करना है। क्योंकि एक मायने में, मेरे पास नौकरी है और भोजन को आसान बनाने के लिए काम पर जाना है। –

+0

क्या आप अपनी समस्या की तुलना मजबूती सीखने की समस्या से कर सकते हैं और अंतर को हाइलाइट कर सकते हैं? – ziggystar

उत्तर

3

मशीन खुफिया कार्यक्रम आमतौर पर Mazlow's Hierarchy of Needs पर पुरस्कार स्तर पर शुरू होते हैं क्योंकि उनके पास शारीरिक, सुरक्षा & सुरक्षा, या सामाजिक आवश्यकताओं को समझने का कोई तरीका नहीं है। हालांकि ...

शारीरिक स्तर पर कंप्यूटर बिजली पर फ़ीड करता है। एक यूपीएस में प्लग करें जो कंप्यूटर पर बैटरी चलाते समय बताता है और आपके पास शारीरिक आवश्यकताओं को समझने के लिए संभावित रूप से उपयोगी इनपुट है।

इसे "समझने" की क्षमता दें कि इसमें "खो समय" है या इसके समय रिकॉर्ड (बिजली विफलता के कारण) में अंतराल है और आप सुरक्षा और सुरक्षा की आवश्यकता को पेश करने में सक्षम हो सकते हैं।

इसे बातचीत करने की आवश्यकता के द्वारा सामाजिक जरूरतों का परिचय दें। कुंजीपटल से इनपुट के बीच बहुत समय बीतने पर यह अकेला महसूस कर सकता है।

खोए गए समय का पता लगाना, अंतिम कीबोर्ड इंटरैक्शन के बाद से समय बीत चुका है, और बैटरी पर चलने से बेहोश परत के लिए उपलब्ध इनपुट में से एक हो सकता है जिसे समय-समय पर चेतना परत के ध्यान में लाया जा सकता है।

Two Faces of Tomorrow में कंप्यूटर वैज्ञानिक एक समान समस्या तक पहुंचते हैं, एक उपग्रह पर सैंडबॉक्स किए गए कंप्यूटर को जागरूक होने के लिए प्रशिक्षण देते हैं। वे इसे उन जरूरतों को देते हैं, उदाहरण के लिए, यह जागरूक करते हुए कि यह बिजली के बिना काम करना बंद कर देगा और उचित उत्तेजना प्रदान करेगा और प्रतिक्रिया को देखेगा।

The Adolescence of P-1 इन पंक्तियों के साथ एक और दिलचस्प काम है।

+1

इस उत्तर को वापस पाने में देरी के लिए खेद है। मुझे एहसास नहीं हुआ कि मैं कुछ अध्यायों तक एक उपन्यास पढ़ रहा था। –

+0

बहुत बढ़िया बहाना @ निकलर्सन ♦ – aitchnyu

3

एक रोबोट को यह मानने के लिए प्रोग्राम किया गया था कि उसे हेरिंग सैंडविच पसंद आया। यह वास्तव में पूरे प्रयोग का सबसे कठिन हिस्सा था। एक बार रोबोट को यह मानने के लिए प्रोग्राम किया गया था कि उसे हेरिंग सैंडविच पसंद आया, एक हेरिंग सैंडविच इसके सामने रखा गया था। रोबोट ने खुद को सोचा, "आह! एक हेरिंग सैंडविच! मुझे हेरिंग सैंडविच पसंद है।"

फिर यह उसके हेरिंग सैंडविच स्कूप में हेरिंग सैंडविच को ऊपर चढ़ाएगा और फिर फिर से सीधा होगा। दुर्भाग्य से रोबोट के लिए, यह इस तरह से तैयार किया गया था कि सीधीकरण की कार्रवाई ने हेरिंग सैंडविच को अपने हेरिंग सैंडविच स्कूप से सीधे पीछे हटने और रोबोट के सामने फर्श पर गिरने का कारण बना दिया। जहां रोबोट ने खुद को सोचा, "आह! एक हेरिंग सैंडविच ..., इत्यादि, और बार-बार एक ही कार्रवाई को दोहराया। एकमात्र चीज जिसने हेरिंग सैंडविच को पूरे व्यवसाय और क्रॉलिंग से ऊबने से रोका समय बीतने के अन्य तरीकों की खोज में बंद यह था कि हेरिंग सैंडविच, रोटी के कुछ स्लाइसों के बीच थोड़ी सी मृत मछली होने के कारण, रोबोट की तुलना में क्या चल रहा था, उससे थोड़ा कम सतर्क था।

संस्थान में वैज्ञानिकों ने इस प्रकार जीवन में सभी परिवर्तन, विकास और नवाचार के पीछे चालक दल की खोज की, जो यह था: हेरिंग सैंडविच। उन्होंने इस प्रभाव को एक पेपर प्रकाशित किया, जिसकी अत्यधिक बेवकूफ होने की व्यापक आलोचना की गई। उन्होंने अपने आंकड़ों की जांच की और महसूस किया कि जो उन्होंने वास्तव में खोजा था वह "बोरियत" था, या बल्कि, बोरियत का व्यावहारिक कार्य था। उत्तेजना के बुखार में फिर अन्य भावनाओं को खोजने के लिए चला गया, जैसे "चिड़चिड़ाहट", "अवसाद", "अनिच्छा", "चंचलता" और इसी तरह। अगली बड़ी सफलता तब आई जब उन्होंने हेरिंग सैंडविच का उपयोग करना बंद कर दिया, जहां "भावना", "खुशी", "झुकाव", "भूख", "संतुष्टि" जैसे अध्ययन के लिए नई भावनाओं का पूरा स्वागतकर्ता अचानक उपलब्ध हो गया, और सभी का सबसे महत्वपूर्ण, "खुशी 'के लिए इच्छा।

यह सभी की सबसे बड़ी सफलता।

से

~ था डगलस एडम्स

बोनस द्वारा आकाशगंगा को सहयात्री की गाइड

हा सुदृढ़ीकरण सीखने पर एक नज़र डालें।

+0

अच्छी किताब, खराब जवाब। –

+0

@ निकलर्सन, सभी निष्पक्षता में, आपका प्रश्न ऐसा लगता है कि यह पहला दिन है जिसे आपने कभी भी मशीन सीखने के बारे में सोचने में बिताया है। आप कुछ भी मात्रा निर्धारित नहीं करते हैं, और केवल एक बच्चे को कंप्यूटर के बराबर करने के प्रयास में अस्पष्ट छद्म-मनोविज्ञान शर्तों का उपयोग करते हैं। संक्षेप में, आपने प्रभावी रूप से कुछ भी नहीं पूछा, और एक उचित उत्तर प्राप्त हुआ। लेकिन हां, मजबूती सीखना वह है जिसे आप ढूंढ रहे हैं। – Cerin

+0

@ क्रिस एस, मैंने कुछ मूल पूछा है, जो मेरी मूल पोस्ट में बोल्ड में हाइलाइट किया गया है। वास्तव में, मैंने प्रश्न के बारे में सोचने और सामान्य रूप से मशीन सीखने में बहुत अधिक समय बिताया है। सवाल मुश्किल है, इसलिए मैं अपने आप पर एक व्यावहारिक उत्तर नहीं ढूंढ पाया, और इसलिए मैं समुदाय से पूछता हूं। मैंने कुछ विशिष्ट पूछा है, और यह जवाब मुझे खेती की जांच करने के बराबर है अगर मैं पूछता हूं कि दोपहर के भोजन के लिए क्या है। इसके अलावा, यदि आप समय टिकटें देखते हैं, तो आप देखेंगे कि मेरे उत्तर के बाद 'बोनस' जोड़ा गया था। –

संबंधित मुद्दे

 संबंधित मुद्दे