2009-02-03 12 views
32

मुझे जावा में टेक्सास होल्ड 'एआई इंजन बनाने में दिलचस्पी है। यह एक दीर्घकालिक परियोजना है, जिसमें से एक मैं कम से कम दो साल निवेश करने की योजना बना रहा हूं। मैं अभी भी कॉलेज में हूं, अभी तक महत्वाकांक्षी कुछ भी नहीं बनाया है और एक ऐसी समस्या से निपटना चाहता हूं जो लंबी अवधि में मेरी रूचि रखे। मैं एआई के क्षेत्र में नया हूं। कॉलेज में मेरे डेटा स्ट्रक्चर क्लास से, मुझे बीएफएस और डीएफएस, बैकट्रैकिंग, डीपी, पेड़, ग्राफ इत्यादि जैसे बुनियादी बिल्डिंग ब्लॉक पता हैं। मैं रेगेक्स सीख रहा हूं, एससीजेपी और एससीजेडी के लिए पढ़ रहा हूं और मैं जल्द ही एक (घना) सांख्यिकी पाठ्यक्रम।टेक्सास होल्डम बिल्डिंग एआई खेलना .. स्क्रैच से

प्रश्न:

- मैं कहां से शुरू करूं? मुझे कौन सी किताबें चुननी चाहिए? एआई पोकर खेलने वाले कार्यक्रम किस तरह से चलते हैं? मैं किस पृष्ठ से ओपन सोर्स प्रोजेक्ट ले सकता हूं? जावा में कोई अच्छा एआई संसाधन? मुझे लिस्प सीखने में भी दिलचस्पी है, क्या जथा अच्छा है?

+10

आप को विकसित करने में सफल रहा है कुछ भी ? यह 2+ साल रहा है ... –

उत्तर

5

पोकर एआई को सही होने के लिए कुख्यात रूप से मुश्किल है क्योंकि इंसान अप्रत्याशित रूप से शर्त लगाते हैं। यह आमतौर पर दो भागों में टूट जाता है।

1) विजेता होने के बावजूद बाधाओं की गणना करें।

2) तैयार करना पर 1.

मैं पढ़ आंकड़े यह पहली बार लाल पर आसान लगता भाग 1. के लिए की बहुत सारी के साथ शुरू की सलाह देते हैं आधारित सट्टेबाजी रणनीति है, लेकिन यह वास्तव में बहुत ही जटिल है (और यह हो रही गलत बर्बाद होगा आपकी एआई)। फिर भाग 2 के लिए जेनेटिक एल्गोरिदम पर जाएं। सट्टेबाजी रणनीतियों ज्यादातर आनुवांशिक एल्गोरिदम हैं। वे पिछली सफलता और असफलताओं के आधार पर खुद को समायोजित करते हैं + कुछ यादृच्छिकरण ताकि भविष्यवाणी न हो।

-1

मैंने सुना है कि एक दिलचस्प परिणाम यह है कि यदि आप सट्टेबाजी विकल्पों को फोल्ड करने के लिए प्रतिबंधित करते हैं, तो जांचें और सभी में, आप एक एआई लिख सकते हैं जो कम से कम 49% की संभावना के साथ एक-दूसरे को जीतता है, और 49.5% यदि यह है (आईआईआरसी) पहले नहीं जा रहा है।

मुझे नहीं पता कि यह एआई लिखना आसान है जो शर्त लगाता है कि कितना शर्त है, लेकिन यह विचार के लिए भोजन है: शर्त लगाने के लिए राशि केवल जीतने की संभावना के 1.5% के लिए खाते हैं।

1

मैंने अपने अंडरग्रेड में होल्डम एआई लिखा था। यह विशेष रूप से उन्नत नहीं था, मैंने एक क्यू-वैल्यू मशीन का उपयोग किया जिसने कई राज्यों को पार किया और प्रत्येक राज्य के लिए क्यू मूल्यों को अद्यतन किया।

मुझे अल्बर्टा की एआई पोकर परियोजना विश्वविद्यालय को नुकसान से बचने के लिए जानकारी का एक अमूल्य स्रोत मिला।

राज्यों के ऊपर एक पोस्टर के रूप में, पहला कदम कुछ निर्धारित करने योग्य पोकर नियमों में नाखून करना है - एक-एक-एक पोकर को प्रोग्रामिक रूप से विकसित किया जा सकता है।

मैं जिस पतन में गिर गया, वह जल्दी से पुनर्निर्मितता में नहीं बना रहा था। उदाहरण के लिए सीखने/खेल के ग्रेड को स्विच करने में सक्षम होना।

मैं तुम मुझे कैसे छोड़ पर gmail.com

2

इसके अलावा में एक मेल stevekeogh मिलता है, आनुवंशिक एल्गोरिथ्म दे तंत्रिका नेटवर्क है, जो निर्णय तर्क निर्धारित करता है के वजन को समायोजित सुनने के लिए दिलचस्पी होगी। यह दृष्टिकोण पोकर एआई के लिए बहुत उपयुक्त है।

मैंने अपनी खुद की एआई बनाई है। सबसे पहले, मैंने ~ 1000 खिलाड़ियों को बनाया, जिन्हें यह नहीं पता था कि खेल को कैसे खेलना है। हाथों के दौरान अपनी शुरुआती किस्मत के आधार पर, उनकी फिटनेस भारित और नई पीढ़ी बनाई गई थी। नई पीढ़ी की तुलना में नया "दिमाग" बेहतर खेल रहा था।

आखिरकार, सर्वोत्तम व्यक्तियों ने बहुत अच्छा खेला।

+4

क्या आपने अपना परिणाम कहीं भी प्रकाशित किया था? –

+0

जब आप सबसे अच्छी तरह से खेला जाता है, तो क्या आप अन्य एआई के खिलाफ या मनुष्यों के खिलाफ मतलब करते हैं? मुझे लगता है कि आनुवंशिक एल्गोरिदम खराब प्रदर्शन करेगा। पोकर आपके विरोधियों को समझने के बारे में है, बाधाओं में नहीं। जब तक आपके अनुवांशिक एल्गोरिदम में सट्टेबाजी के दौरान बटन से दूरी के बारे में जानकारी शामिल नहीं होती है, तो मुझे आपका परिणाम संदिग्ध लगता है। – jmucchiello

+1

आपको यह नहीं मिला। जीए ने बिल्कुल प्रदर्शन नहीं किया, तंत्रिका नेटवर्क ने किया। जीए उनकी सफलता के आधार पर जाल (वजन समायोजित) विकसित करने के लिए था। मैंने सबसे अच्छे व्यक्ति के खिलाफ खेला और यह बहुत अच्छा था। इसके तर्क में कोई पता लगाने योग्य पैटर्न नहीं था। मैंने एक पोकर क्लाइंट से 500k हाथों को भी सीमित किया, और कुछ बेहतरीन खिलाड़ियों (तंत्रिका नेटवर्क के साथ) से मॉडल बनाए। सर्वश्रेष्ठ व्यक्ति ने भी इन्हें हराया। एक लाख हाथों के बाद औसत बीबी लगभग 1.5 थी। – nhaa123

2

जैसा कि पहले से ही अनुशंसित है, पुस्तक पोकर की थ्योरी खेल खेलने के साथ-साथ एआई बनाने के लिए जानकारी का वास्तव में अमूल्य स्रोत है। आपको शायद इसे खरीदना चाहिए क्योंकि इससे ज्यादा खर्च नहीं होता है।

अल्बर्टा पुनर्विक्रय समूह विश्वविद्यालय इस समय अत्याधुनिक करता है, हालांकि उनके पास हर समय और फिर उभरती कठोर प्रतिस्पर्धा है। (इंटरनेट पोकर में किसी के नतीजों का उपयोग करने के प्रलोभन के कारण क्षेत्र में सभी पोकर बॉट और एआई अनुसंधान सार्वजनिक नहीं है, हालांकि यह प्रतिबंधित है।)

सबसे पहले आपको यह तय करना चाहिए कि आप किस प्रकार के पोकर से निपटने जा रहे हैं। दो खिलाड़ी होल्डम काफी हल हो गए हैं, हालांकि सर्वश्रेष्ठ इंसान अभी भी सर्वश्रेष्ठ एआई के उपलब्ध होने के साथ असली लड़ाई कर रहे हैं। एआई के पास मनुष्यों पर पिछले हाथों की असीमित दोषहीन स्मृति, उस पर आधारित पैटर्न के दोषपूर्ण विश्लेषण और मशीनों के रूप में मनुष्यों पर मुख्य लाभ हैं, वे कभी-कभी लगभग सभी मनुष्यों की तरह झुकाव नहीं करते हैं।

फिक्स्ड होल्डम शायद क्रैक करने के लिए सबसे आसान है, इसलिए आप 1-1 निश्चित होल्डम के साथ शुरू करना चाहेंगे और फिर तय करें कि आप आगे क्या करना चाहते हैं।

  • एक नकद खेल एक टूर्नामेंट -इस खिलाड़ियों की संख्या से अलग है निर्णय अलग बनाता है:

    यहाँ कुछ पहलुओं जो सही रणनीति (और अपने ऐ) बदल रहे हैं।

  • होल्डम एकमात्र पोकर नहीं है। ओमाहा, स्टड और अन्य मौजूद हैं और व्यापक रूप से खेले गए हैं।
  • फिक्स्ड सीमा पॉट सीमा से अलग है, जो सीमा से अलग है।
  • सबसे अच्छी चीजों को कवर करने के लिए आपको सबसे अच्छी चीजों को कवर करने के लिए सर्वश्रेष्ठ खिलाड़ियों को लगता है कि वे कब खेलते हैं। कम-स्टेक शौकिया गेम को हरा करने के लिए, इनमें से कोई भी चीज़ गिनती नहीं है।

आप कोई सीमा नहीं होल्डम के लिए जाने का निर्णय, तो आप होल्डम और एक किताब कोई सीमा पोकर पर तीन पुस्तक श्रृंखला हैरिंगटन की जाँच करने के लिए चाहते हो सकता है - सिद्धांत और व्यवहार। पोकर पर कई किताबें पढ़ने के बाद, मैं कह सकता हूं कि इन किताबों को पोरी थ्योरी के साथ संयुक्त किया गया है।

3

मैं जावा

में एक टेक्सास होल्डम वीडियो पोकर इंजन लिखा

इस कोड को बस लिंक को जोड़ने के लिए विचारों और दूसरों

http://github.com/phstc/javapokertexasholdem

0

बिना टेक्सास होल्डम के लिए एक कोर इंजन है उपरोक्त, कार्यान्वित करने वाली महत्वपूर्ण चीजों में से एक http://en.wikipedia.org/wiki/Kelly_criterion होगा जो दांवों की श्रृंखला में अपेक्षित बाधाओं को देखते हुए दांव के इष्टतम आकार को समझने में मदद करेगा। मनुष्यों के साथ बाधाओं के फैसले में त्रुटियां हो सकती हैं, लेकिन यदि आपका एआई प्रोग्राम एल्गोरिदम के आधार पर कुछ अपेक्षित सामान्य बाधाओं को थूक सकता है तो यह शर्त आकार देने वाली तकनीक जो लाभ जुआरी के लिए जोखिम और इनाम दोनों को संतुलित करती है, वह एक अच्छा सस्ता होगा उपाय।

2

मुझे यकीन नहीं है कि आप किस सटीक गेम में रूचि रखते हैं, लेकिन सामान्य दृष्टिकोण गेम के बहुत छोटे सार संस्करण को बनाने, छोटे खेल को हल करने और फिर असली गेम स्थितियों को अमूर्त गेम में मैप करने के लिए है सलाह उत्पन्न करें। अधिकांश अकादमिक पत्र अभिसरण, शोषण और प्रतिस्पर्धा के परिणामों के परिणाम प्रस्तुत करने के पक्ष में इस प्रक्रिया के विवरण पर छोड़ देते हैं।

हालांकि, कुछ सार्वजनिक रूप से उपलब्ध कोड बेस हैं जो एक पूर्ण कार्यान्वयन प्रस्तुत करते हैं।

http://www.deducer.org/pmwiki/pmwiki.php?n=Main.ArtificialIntelligencePoker

यह एक बुनियादी पूरा रणनीति बॉट सार खेल के लिए रणनीति का अनुकूलन करने के काल्पनिक खेल का उपयोग करता है: सबसे अच्छा लोगों में से एक फेल शगुन है। यह एक अच्छा प्रारंभिक बिंदु है क्योंकि यह काफी सरल, पूर्ण है, और अमूर्त गेम दृष्टिकोण की एक अच्छी प्रस्तुति का प्रतिनिधित्व करता है।

आप पोकर ऐ को विकसित करने में रुचि रखते हैं, मैं 2007 से और पर यूए पोकर समूह और टॉमस Sandholm के छात्रों से सब कुछ पढ़ने का सुझाव होगा:

http://www.cs.cmu.edu/~sandholm/

http://poker.cs.ualberta.ca/publications.html

संबंधित मुद्दे