โดย James Georgian บอกฉันเกี่ยวกับโดรนของ Netflix ที่ชื่นชอบ Queen’s Gambit (ปี 2020) แต่ฉันเป็นแฟนหมากรุกมาโดยตลอดในช่วงปีที่เรียนมหาลัยฉันอาจจะกินครัวซองต์ช็อคโกแลตหนึ่งพันชิ้นในขณะที่ดูครู Turnbull ที่แปลกและน่าทึ่ง (รู้จักกันในชื่อ “Chess Master”)) นำผู้เยี่ยมชมทุกคนในจัตุรัสกลางเมือง – “$ 2 คืนเงินหากคุณชนะหรือทำได้” เป็นเกียรติของฉันที่ได้ถ่ายภาพ Karpov ที่ยิ่งใหญ่ซึ่งล้อมรอบด้วยหน้าต่างกระจกสีของ ห้องโถงที่ระลึกเมื่อเขาจำลองกระดาน 40 แผ่นในมหาวิทยาลัยฉันเป็นส่วนหนึ่งของสื่อมวลชนของนักเรียนเมื่อคาสปารอฟกล่าวคำพูดที่ขัดแย้งกันในตอนนั้นว่าคอมพิวเตอร์จะเป็นแชมป์ที่ยิ่งใหญ่ก่อนที่ผู้หญิงจะเป็นอย่างมีนัยสำคัญในขณะที่คอมพิวเตอร์มีประสิทธิภาพอยู่แล้ว และรวดเร็วเครื่องจะแนะนำความเท่าเทียมกันใหม่ซึ่งทุกสายพันธุ์ถูกบดขยี้เหมือนมดทฤษฎีบทของ Zermello บอกเราว่าเกมที่มีข้อมูลครบถ้วน (ผู้เล่นทั้งสองสามารถเห็นทุกส่วนบนกระดานหมากรุก) ถือเป็นที่สิ้นสุด (เกมจะจบลงหลังจาก จำนวนการเคลื่อนไหว) เขามีวิธีแก้ปัญหาและถ้าทั้งสองฝ่ายเล่นปากกัน ข้อได้เปรียบที่ดีที่สุดแล้วทุกเกมก็ให้ผลลัพธ์เหมือนกัน หมากรุกมีความซับซ้อนมากพอที่เราไม่แน่ใจว่าผลลัพธ์จะเป็นอย่างไร แต่เราคิดว่าไวท์จะชนะทุกครั้งและในกรณีนั้นจะไม่มีปฏิกิริยาสีดำที่สามารถเปลี่ยนแปลงผลลัพธ์ได้ เกม Connect Four ตกอยู่ภายใต้ทฤษฎีบทของ Zermelo เช่นกันและการวิเคราะห์ระบุว่าในเกมนั้น sis ส่อเสียดจะชนะเสมอถ้าเธอไปก่อนและเล่นอย่างเหมาะสมที่สุด หากคุณเป็น AP ที่ชื่นชอบ QGambit และหิวกระหายเนื้อหามากขึ้นในช่วงภัยพิบัติที่ไม่สิ้นสุดนี้ภารกิจต่อไปของคุณคือการดู AlphaGo ซึ่งเป็นสารคดีเกี่ยวกับการเพิ่มขึ้นของคอมพิวเตอร์ในเกมโบราณของ Go ซึ่งซับซ้อนกว่าหมากรุก ไม่ล้อเล่นหนังเรื่องนี้เป็นเรื่องที่ฉีกขาดสำหรับผู้ที่สนใจในสาขานี้และชื่นชมกับละครอารมณ์เข้มข้นของแชมป์แห่งมนุษยชาติ Lee Sedul – ที่ดีที่สุดเท่าที่เคยมีมา ภาพยนตร์เรื่องนี้ถ่ายทอดความทุกข์ยากความกล้าหาญความฉลาดและความอ่อนน้อมถ่อมตนของ Sedul โดยตระหนักดีว่าการปรับตัวต่อหน้าเครื่องจักรไม่ใช่แค่เกม แต่เป็นการเกิดขึ้นของระเบียบโลกใหม่ เขาไม่ได้เป็นโปรแกรมเมอร์เซดูลไม่ได้ชื่นชมสิ่งที่เขากำลังเผชิญ แต่ในฐานะผู้เชี่ยวชาญในงานฝีมือของเขาเขาสามารถสัมผัสได้ถึงน้ำหนักของคู่ต่อสู้ที่ไม่หยุดหย่อนและไม่สามารถยอมรับได้บนกระดาน หลังจากที่คุณสนุกกับ AlphaGo แล้วฉันขอแนะนำ (จริงๆแล้ว Google แนะนำ) ให้คุณดูเกมโป๊กเกอร์ระหว่าง Dan Negrano จากโรงเรียนเก่าและคอมพิวเตอร์โคลน Doug Polk ที่ทันสมัย ผู้เล่นที่ดีที่สุดในโลกคือเครื่องจักรดังนั้นคนฉลาดอย่างโฟล์กก็เลียนแบบกลยุทธ์ของเครื่องจักรได้ ปรับตัวหรือตาย ครั้งหนึ่งฉันเคยแลกเปลี่ยนสั้น ๆ กับ Howard Lederer ฉันถามเขาเกี่ยวกับบอทในเว็บไซต์โป๊กเกอร์ เขาตัดพ้อประเด็นนี้โดยกล่าวว่า “โป๊กเกอร์ไม่เหมือนหมากรุกโป๊กเกอร์เป็นเกมที่มีข้อมูลครบถ้วนคอมพิวเตอร์ไม่ถนัด” ฉันไม่สามารถบอกได้ว่าเขาเป็นคนโง่ไร้เดียงสาหรือเป็นเด็กคุนแมนสำหรับ Tilt Polly ไม่ว่าจะด้วยวิธีใดฉันไม่ต้องการสนทนาต่อไปก่อน 15 ปี แต่ตอนนี้ที่นี่ในปี 2021 และถึงเวลาที่จะสนทนาต่อไปโดยหักล้างความล้มเหลวครั้งแรกเกี่ยวกับคอมพิวเตอร์ GTO (ทฤษฎีเกมที่ดีที่สุด) และข้อผิดพลาดที่ทับซ้อนกันทั้งหมดที่ ไดโนเสาร์โป๊กเกอร์และผู้ดูแลโป๊กเกอร์ต่างก็ยึดติดกับ: ความผิดพลาด # 1: คอมพิวเตอร์ไม่เก่งในเกมที่มีข้อมูลไม่สมบูรณ์เป็นเพียงการไม่รู้เป็นความจริงที่ทฤษฎีบทของ Zermelo ใช้ไม่ได้กับเกมเช่นโป๊กเกอร์สำหรับโป๊กเกอร์มี ทฤษฏีอื่น ๆ ที่บอกว่ามีวิธีแก้ปัญหาสำหรับเกมจริง ๆ และวิธีแก้ปัญหาคอมพิวเตอร์มักจะเกี่ยวข้องกับ “กลยุทธ์ผสม” (เช่นเดียวกับการเรียกกรรไกรด้วยความน่าจะเป็น 1/3) คอมพิวเตอร์สวยดีกว่ามนุษย์ในการคำนวณความน่าจะเป็นที่คาดหวัง ผลลัพธ์โดยเฉพาะอย่างยิ่งเมื่อทราบการแจกแจงความน่าจะเป็นอย่างชัดเจนเช่นเดียวกับในเกมไพ่ตัวอย่างเช่นคอมพิวเตอร์รู้แน่ชัดว่าความน่าจะเป็นในการดึงแฟลชประตูหลังคืออะไรและโอกาสที่พวกเขาต้องการเพื่อปรับการไล่ล่าแม้ว่าโป๊กเกอร์จะมีไม่สมบูรณ์ก็ตาม ข้อมูลหัวหน้า Fook Unlimited R เป็นเกมที่ง่ายกว่า Go แม้ว่า Go จะมีข้อมูลที่ครบถ้วน (ข้อมูลที่ทุกคนทราบ) ความล้มเหลว # 2: ความเหนือชั้นของคอมพิวเตอร์เกิดจากความสามารถในการจำแต่ละมือที่ฉันเล่นและปรับเปลี่ยนตามนั้น ในขณะที่ “บอทที่หาประโยชน์” จะวิเคราะห์เกมที่ผ่านมาของคุณและตรงกับการรับรู้ที่รับรู้ แต่บอท GTO มาตรฐาน (ซึ่งเราเรียกว่า “บอทแนช”) เทียบเท่ากับ BS poker ในแบล็คแจ็ค กลยุทธ์ GTO ไม่เปลี่ยนแปลงไม่ว่าคุณจะเล่นในมือก่อนหน้าอย่างไร ไม่ต้องการข้อมูลนี้และไม่สนใจ ความล้มเหลว 3: วิธีแก้ปัญหา GTO นั้น “ถูกต้อง” ก็ต่อเมื่อเล่นกับบ็อต GTO อื่นเท่านั้นเพราะนั่นคือสิ่งที่เขาคิดขึ้นเมื่อบอตถูกพัฒนาบอท “เรียนรู้” โดยการเล่นกับตัวเอง นี่คือความผิดพลาด “บอทเล่นกับตัวเองเพื่อเรียนรู้โป๊กเกอร์” เป็นลักษณะที่ไม่ถูกต้องของกระบวนการพัฒนา สื่อชอบที่จะเอียงการคลิกเพื่อให้ผลลัพธ์ใด ๆ ในการประมวลผลเสียงเหมือนการพัฒนามาหลายชั่วอายุคนในขณะที่อ่าน HAL และ Skynet บอท GTO ไม่รู้อะไรเลยเกี่ยวกับโป๊กเกอร์ ที่มาของกลยุทธ์ GTO เป็นแบบฝึกหัดการคำนวณซึ่งช่วยให้ต้องขอบคุณความเร็วหน่วยความจำและโปรเซสเซอร์ขนาดใหญ่ที่มีอยู่ในคอมพิวเตอร์ในปัจจุบันและการพัฒนาอัลกอริทึมที่มีประสิทธิภาพสำหรับการคำนวณ (“การลดความเศร้าโศก”) เราไม่เคยอธิบายอัลกอริทึมว่า “แมชชีนเลิร์นนิง” หรือ “AI” – ครั้งหนึ่งเราเรียกมันว่า “การปีนเขา” หรือ “การเพิ่มประสิทธิภาพสูงสุด” หรือ “การเพิ่มประสิทธิภาพ” ในแต่ละขั้นตอนในอัลกอริทึมซ้ำคอมพิวเตอร์จะแสดงกลยุทธ์ปัจจุบันสำหรับแต่ละที่นั่งที่โต๊ะและกลยุทธ์ปัจจุบันสามารถอธิบายได้ว่า “ตัวมันเอง” เช่น “PokerSnow เล่นกับตัวเอง” แต่จริงๆแล้วมันเป็นเพียงการวนซ้ำ ทางขึ้นเขาเพื่อมาบรรจบกันถึงจุดสุดยอด – กลยุทธ์ที่ดีที่สุดในการเล่นโป๊กเกอร์ ความเหมาะสมนี้ไม่ถือว่าคู่ต่อสู้รายใดเป็นพิเศษ มีวิธีอื่น ๆ ที่เราสามารถคำนวณวิธีแก้ปัญหาได้ (แม้ว่าอาจจะไม่เร็วนัก) และวิธีนี้จะใช้ได้อย่างเท่าเทียมกัน กลยุทธ์ GTO นี้เป็น “หนังสือ” สำหรับโป๊กเกอร์และจะไม่อยู่ในตำแหน่งที่ด้อยกว่าโดยไม่คำนึงถึงฝ่ายตรงข้าม ไม่มีกลยุทธ์ใดที่จะได้เปรียบกับมัน ความล้มเหลว # 4: บ็อต GTO คิดว่าฉันจะเล่นด้วยวิธีใดวิธีหนึ่ง แต่ฉันปลุกมันด้วยการเล่นชุด 72 ของฉันออกจากตำแหน่ง ไม่จริง. บ็อต GTO จะไม่ถือว่าคุณเล่นอย่างไร เขาไม่สนใจ. ไม่มีใครเทียบได้กับกลยุทธ์ของฝ่ายตรงข้าม ลองนึกภาพว่าคุณกำลังจะเจอศึกกับฟลอยด์เมย์เวทเธอร์และคุณพูดว่า “ฟลอยด์คาดหวังให้ฉันปรากฏตัวในสภาพร่างกายที่ไร้ที่ติเขาคิดว่าฉันจะฝึกหนักในอีกหกเดือนข้างหน้าฉันจะจับแขนเขา – ฉันจะ แค่ดู Netflix และกินโดนัทในอีกหกเดือนข้างหน้า “Floyd ไม่รู้ว่าคุณจะฝึกหนักแค่ไหน เขารู้ดีว่าถ้าตัวเขาเองจะแสดงได้อย่างสมบูรณ์แบบไม่มีฝ่ายตรงข้ามที่จะได้เปรียบเขา มันสมเหตุสมผลหรือไม่ที่จะพูดว่า “บอทถือว่าฉันเล่นได้ดีฉันโกงบอทด้วยการเล่นโป๊กเกอร์ที่ไม่ดีใช่คุณต้องแสดงให้เห็น! ความล้มเหลว # 5: ฉันพบจุดอ่อน – เมื่อฉันมีสิ่งนี้และ จากนี้และสถานการณ์นั้นบอทต้องทำ X แต่มันทำให้ Y ผิดบอทไม่มีจุดอ่อนคุณดูที่การจับมือบางอย่างและผลลัพธ์บางอย่าง แต่ขึ้นอยู่กับความน่าจะเป็นที่จะอยู่ใน สถานการณ์นี้และมือที่เป็นไปได้ทั้งหมดที่คุณสามารถถือได้จากมุมมองของบอทเกมของมันถูกต้องและคุณไม่พบมีรูมันอันตรายมากที่จะดูการแสดงแยกจากกันบอททำการเคลื่อนไหวเพื่อปรับสมดุล ช่วงที่คุณไม่สามารถสิ่วในสถานการณ์อื่น ๆ หรือหากไพ่คนละใบขึ้นไปบนแม่น้ำหากคุณไม่เห็นมันแสดงว่าข้อบกพร่องอยู่ที่ความคิดโป๊กเกอร์ของคุณไม่ใช่ของบอทความล้มเหลว 6: ถ้าฉันเล่นไปสักพัก ฉันจะเข้าใจว่ามันเล่นยังไงและหาจุดอ่อนผิดไม่มีจุดอ่อนอันที่จริงเราสามารถเผยแพร่กลยุทธ์ของบอทได้และมันก็คงไม่สำคัญถ้าฉันบอกคุณว่าฉันจะเล่นกรรไกรโยกและกระดาษด้วย 1 / 3 ความน่าจะเป็นในแต่ละข้อความจริงที่ว่าคุณรู้ว่ากลยุทธ์ของฉันไม่ได้ทำให้คุณมีความสามารถในการได้เปรียบใด ๆ ไม่มีส้นเท้าของ Achilles ความล้มเหลว # 7: หุ่นยนต์ Heads-Up Limit ที่ใส่ในคาสิโนได้รับชัยชนะอย่างมากดังนั้น ก็อาจจะเช่นกัน บ็อต GTO นี่ไม่ใช่การเปรียบเทียบที่สำคัญ ร้านบูติกของคาสิโนบางแห่งได้รับคำสั่งไม่ให้เล่นเกม A เพราะมันแข็งแกร่งเกินไปสำหรับคนทั่วไป หากคาสิโนกำหนดให้บอทเล่นในเกม B ยกตัวอย่างเช่นได้เปรียบผู้เล่นส่วนใหญ่ 5% คนที่เก่งจริงๆสามารถสร้างรายได้จากบอทของ GTSO (ทฤษฎีเกมที่ไม่เหมาะสม) แต่นั่นเป็นหัวข้อที่แตกต่างกัน ฉันไม่สนใจว่าคุณเป็นใคร: ถ้าคุณเล่นตัวต่อตัวกับ PokerSnowie คุณจะแพ้ ความล้มเหลว # 8: บอท GTO สามารถเอาชนะผู้เล่นที่อ่อนแอได้ แต่หุ่นยนต์จะมีช่วงเวลาที่ยากลำบากในการต่อสู้กับคู่แข่งชั้นนำอย่าง Phil Ivy หรือ Dan Negrano ไม่จริง. สิ่งที่ดีเกี่ยวกับบ็อต GTO คือไม่สำคัญว่าคู่ต่อสู้จะเป็นใคร อย่างดีที่สุดใครบางคนสามารถเล่นกับบอทได้ วงแหวนของบ็อต GTO จะเป็นเหมือนอ่างโดยมีเงินไหลตามเข็มนาฬิกาไล่ไปที่ปุ่มระบายตรงกลางโต๊ะเนื่องจากคราด ปัญหาในทางปฏิบัติที่มืออาชีพในโลกแห่งความเป็นจริงเคยมีในอดีตคือการตัดสินใจว่าเมื่อใดที่ทักษะของพวกเขาจะเพียงพอที่จะก้าวข้ามการเดิมพันที่สูงครั้งต่อไปซึ่งผู้เล่นมีแนวโน้มที่จะแข็งแกร่งขึ้น แต่ตอนนี้ผู้เล่นที่เลียนแบบกลยุทธ์ GTO สามารถนั่งลงที่โต๊ะใดก็ได้ในโลกในจำนวนเท่าใดก็ได้และไม่ต้องกังวลว่าจะเป็นปลา อย่างดีที่สุดเกมจะมีความสม่ำเสมอ (นอกคราด) และในทางปฏิบัติกลยุทธ์ GTO จะให้ข้อได้เปรียบเหนือใครก็ตามที่เผชิญหน้ากับธรรมชาติ ความล้มเหลว # 9: Dan Negrano เป็นมืออาชีพโป๊กเกอร์มืออาชีพที่มีกำไล N ดังนั้นเขาจะทำลายเครือข่ายคอมพิวเตอร์อย่าง Doug Polk ที่ไม่เข้าใจความแตกต่างของโป๊กเกอร์จริง ถ้าผู้ชายอย่างโฟล์กจำ “ชาร์ต” และเลียนแบบกลยุทธ์ GTO ได้เขาก็ไม่ควรเข้าใจสิ่งที่น่ารังเกียจ เขาไม่จำเป็นต้องรู้ว่าคำว่า “แตกต่างกันนิดหน่อย” หมายถึงอะไร มันเป็นประสบการณ์การเล่นโป๊กเกอร์ของมืออาชีพอย่าง Negreanu ที่ทำให้พวกเขาเข้าใจเกมที่ดีที่สุดในสถานการณ์ที่ซับซ้อน ประสบการณ์นี้ล้าสมัยแล้วหลังจากที่คอมพิวเตอร์คำนวณว่าการแสดงผลที่ถูกต้องเป็นอย่างไร บางทีในปี 1950 ประสบการณ์ของผู้เล่นทำให้เขาสามารถตัดสินได้ว่าการตี 14 ต่อ T นั้นดีกว่าการยืน เมื่อผู้ขับขี่ทั้งสี่คำนวณแผนภูมิ BS แล้วประสบการณ์การเล่นแบล็คแจ็คก็ไม่เกี่ยวข้อง หนังสือกลายเป็นประสบการณ์ที่ไม่จำเป็น ตอนนี้ Doug Polk ไม่ใช่ GTO bot เป็นผู้เชี่ยวชาญชั้นนำที่ใช้กลยุทธ์ GTO ดังนั้นช่างไม้คนเดียวที่จะเอาชนะ Polk ได้ก็คือถ้าการเลียนแบบ GTO ของ Polk นั้นไม่ถูกต้องและถ้ารูมีขนาดใหญ่พอที่ช่างไม้จะค้นพบและใช้ประโยชน์จากมันได้ ฉันสงสัย อีกระยะหนึ่งคือถ้าพวกเขาจะเล่นสดและถ้า Polk มีหนังสือจริงที่จะให้ข้อมูลเกี่ยวกับไพ่โฮลของเขาและถ้า Nagriano สามารถอ่านได้ด้วยวิธีนั้น หรือถ้า Polk มีปัญหาด้านอคติและเริ่มเบี่ยงเบนจาก GTO หากเขามีไพ่ที่ไม่ดี ไม่น่าเป็นไปได้ หรือบางทีเกมอาจจะสั้นพอที่เราจะได้รับตัวอย่างเล็ก ๆ หลังจากเล่นกับ AlphaGo แล้ว Lee Sedul ก็อัปโหลดเกมของเขาและเริ่มขยี้ทุกคน (ไม่ใช่ว่าเขายังไม่ได้ทำ) แต่หลังจากนั้นก็ออกจากเกม! เขายอมรับว่าเขาได้รับรางวัล (ช่างเป็นแนวคิด!) และไม่มีมนุษย์คนใดที่จะท้าทายผู้เล่นที่ดีที่สุดในโลก AlphaGo ยังคงต้องรอดูว่า Langrano จะมีการเปิดเผยแบบเดียวกันหรือไม่ ทวีตสุดท้ายทำให้ฉันสงสัยเพราะ Negrano ดูเหมือนจะตั้งคำถามกับบอทเล่นและแสดงให้เห็นว่ามีเส้นแบ่งระหว่างอัจฉริยะกับเรื่องไร้สาระ ฉันคิดว่าเขายังคงหวังว่าจะมีข้อบกพร่องในกลยุทธ์ GTO ไม่มีอะไร ล่าสุดฉันได้ยินมาว่า Nagrano ได้รับการอัปเดตเกี่ยวกับการแข่งขันและมีข้อบ่งชี้ว่าเหตุผลหนึ่งคือเพื่อเครดิตของเขาควรกล่าวว่า Nagrano กำลังฝึกกับ PokerSnowie และปรับตัว! หาก Negreanu สามารถเรียนรู้กลยุทธ์ GTO ได้อย่างรวดเร็วเขาสามารถยกระดับสนามแข่งขันได้และนั่นจะเป็นความสำเร็จที่ยิ่งใหญ่ วิธีเดียวที่ไดโนเสาร์จะอยู่รอดได้คือวิวัฒนาการ เห็นได้ในปี 2564

[Next time, I’ll discuss some of the limitations and weaknesses of the poker bots, unless we thrash them out in the Comments below.]


สมัคร คาสิโน ออนไลน์
ดาฟาเบท คาสิโน มือถือ
คาสิโน ฝาก ถอนไม่มีขั้นต่ำ
คาสิโน เครดิตฟรี
คาสิโน ฟรีเครดิต