Back to Blogs

โป๊กเกอร์เฟซ : ทำไมการเล่น ‘โป๊กเกอร์’ จึงสำคัญสำหรับการพัฒนาปัญญาประดิษฐ์

พฤษภาคม 9, 2017 2:09 PM
views
poke-ai-01

คุณคงรู้ว่าปัจจุบันปัญญาประดิษฐ์สามารถเอาชนะผู้เล่นระดับโปร ในเกมที่ว่ากันว่าซับซ้อนกว่าหมากรุกไม่รู้กี่เท่า – อย่างเกมโกะ ได้แล้ว, มันเป็นข่าวดังเมื่อสักปลายปีก่อน ที่มีผู้เล่นลึกลับ เอาชนะมือโปรคนแล้วคนเล่าบนแพลตฟอร์มการแข่งขันโกะออนไลน์ จนผู้คนเริ่มสงสัยว่าเจ้า ‘ผู้เล่น’ คนนี้เป็นใคร – เป็นคนแน่ๆ หรือเปล่า – แล้วความจริงก็เปิดเผยออกมาว่า ผู้เล่นคนนี้เป็นปัญญาประดิษฐ์ที่มีชื่อว่า AlphaGo ในที่สุด

คุณอาจสงสัยว่าแล้วพรมแดนถัดไปของการพัฒนาปัญญาประดิษฐ์คืออะไร ก็ในเมื่อมันเอาชนะเกมที่ซับซ้อนทั้งหมากรุก ทั้งโกะได้แล้ว ‘เกม’ ต่อไปที่ปัญญาประดิษฐ์จะมาโค่นมนุษย์นั้นคืออะไรกันแน่

คุณอาจไม่เชื่อ ถ้าผมบอกว่าเกมที่นักพัฒนาปัญญาประดิษฐ์เล็งไว้ว่าเป็นพรมแดนต่อไป คือ ไพ่โป๊กเกอร์!

แล้วปัญญาประดิษฐ์อันชาญฉลาดก็ดันเอาชนะมือโปรโป๊กเกอร์ได้สำเร็จแล้วเสียด้วยเมื่อเดือนมกราคมที่ผ่านมา!

ปัญญาประดิษฐ์ตัวนี้ชื่อว่า Libratus ได้รับการพัฒนาจากนักวิจัยจากมหาวิทยาลัยคาร์เนกี้ – เมลลอน พวกเขาพัฒนา Libratus จนมั่นใจว่าน่าจะเทียบชั้นกับมือโปรได้แล้ว เมื่อเดือนมกราคมนักวิจัยคู่นี้จึงเรียกมือโปรโป๊กเกอร์ 4 คน มาที่ริเวอร์ส์คาสิโน (Rivers Casino) ในเมืองพิตต์เบิร์กส์

ผลปรากฏว่า Libratus ชนะมือโปรแบบขาดลอย ไม่ทิ้งฝุ่นเสียด้วยซ้ำ ตอนจบเกม Libratus มีชิปมูลค่ารวมทั้งหมดถึง 1.8 ล้านดอลล่าร์ ในขณะที่มือโปรทั้งสี่มีเงินในมือเป็นมูลค่าติดลบ – มือโปรคนหนึ่งถึงกับให้สัมภาษณ์กับ The Guardian ว่า การแพ้ครั้งหนึ่งยังไม่เท่าไหร่ แต่เมื่อคุณแพ้ ซ้ำแล้วซ้ำเล่า ครั้งแล้วครั้งเล่า ต่อคู่ต่อสู้ไร้หน้า คุณก็คงอดไม่ได้ที่จะสูญเสียกำลังใจ เขาบอกว่า “ถ้าคุณเล่นโป๊กเกอร์กับคน แล้วคุณแพ้ คุณก็อาจจะหยุดพักตรงนั้นสักครู่ ไปทำอย่างอื่น แล้วค่อยกลับมาเล่นต่อ แต่กับการทดสอบปัญญาประดิษฐ์ครั้งนี้ พวกเราต้องมานั่งเล่นโป๊กเกอร์ซ้ำแล้วซ้ำอีก แล้วก็แพ้แล้วแพ้อีก ทุกวัน วันละ 11 ชั่วโมง ผมไม่ค่อยชินกับความพ่ายแพ้ พอต้องมาแพ้ติดๆ กันแบบนี้ จึงเกิคความรู้สึกรุนแรงมาก” (แต่ไม่ต้องสงสารพวกเขานะครับ – มือโปรสี่คนนี้ได้เงินแบ่งกันจากกองกลาง 200,000 เหรียญ ขึ้นกับว่าใครทำผลงานได้ดีแค่ไหน)

ทำไมการเล่นโป๊กเกอร์ (โดยเฉพาะโป๊กเกอร์แบบ Texas Hold’em) จึงสำคัญสำหรับการพัฒนาปัญญาประดิษฐ์นัก

poker-texas

คำอธิบายหนึ่งก็คือ เพราะโป๊กเกอร์นั้นต่างจากเกมอย่างโกะหรือหมากรุก – คุณจะไม่มีวันเห็นข้อมูลทั้งหมดอยู่ตรงหน้า คุณจะไม่รู้ว่าคู่ต่อสู้มีไพ่อะไร (ต่างจากเกมหมากรุก ที่คุณเห็นกระดานทั้งเกม และเกมโกะ ที่คุณก็รู้ว่าคู่ต่อสู้นั้นก็มีตัวหมากเหมือนๆ กับคุณนั่นแหละ) เกมแบบนี้เรียกว่าเกม “ข้อมูลไม่สมบูรณ์” (imperfect information) ซึ่งคุณไม่สามารถพัฒนาปัญญาประดิษฐ์โดยใช้วิธีคำนวณตรงๆ และจำลองทุกสถานการณ์ออกมาให้เห็นได้ เพราะมีตัวแปรที่ไม่รู้มากเกินไป ดังนั้นปัญญาประดิษฐ์ที่จะเล่นโป๊กเกอร์ (เกมที่ทดลองคือกติกา Texas Hold’em และที่สำคัญคือ ‘เล่นแบบไม่มีลิมิตเงิน’) จึงต้องใช้ทฤษฎีเกมมาคำนวณผลได้ – ผลเสียจากการเล่นในรูปแบบต่างๆ กัน

Andrew Ng นักวิจัยปัญญาประดิษฐ์ชื่อดังบอกว่า “โป๊กเกอร์เป็นหนึ่งในเกมที่ยากที่สุดสำหรับปัญญาประดิษฐ์ เพราะไม่มีทางเลือกใดทางเลือกหนึ่งที่เป็นทางเลือกที่ดีที่สุด แต่ปัญญาประดิษฐ์จะต้องสุ่มการกระทำของมันแทน เพื่อหลอกล่อไม่ให้คู่ต่อสู้รู้ว่ามันกำลังบลัฟอยู่ หรือมันกำลังมีไพ่ที่ดีจริงๆ” นี่เป็นความเห็นที่เป็นไปในทางเดียวกันกับ Vincent Conitzer ศาสตราจารย์จากมหาวิทยาลัยดุ๊ก ที่บอกว่า “การเล่นแบบใดแบบหนึ่งจะดีหรือไม่ ก็ขึ้นอยู่กับสิ่งที่คุณไม่รู้ (มองไม่เห็น) ทั้งนั้น และนอกจากนั้น ปัญญาประดิษฐ์ของคุณยังต้องทำตัวให้คาดเดาไม่ได้ด้วย เพราะผู้เล่นโป๊กเกอร์ที่ดีก็จะต้องรู้จักบลัฟเสียบ้าง”

ดังนั้นความยากของเกมโป๊กเกอร์ คือ หนึ่ง คุณไม่มีหนทางที่ดีที่สุดที่ชัดเจน เพราะมีข้อมูลที่คุณไม่รู้มากเกินไป และสอง ถึงแม้คุณจะมีหนทางที่ดีพอสมควรอยู่ในมือ แต่การเล่นหนทางเหล่านั้นเสมอ ก็จะทำให้คู่ต่อสู้สามารถ ‘เดาทาง’ คุณได้ถูก คุณอาจต้องเลือกทางที่ไม่ดีนักบ้าง เพื่อทำให้คู่ต่อสู้ไม่รู้ว่าคุณจะมาไม้ไหนกันแน่

การพัฒนาปัญญาประดิษฐ์เพื่อเล่นโป๊กเกอร์นั้นดีต่อวงการปัญญาประดิษฐ์โดยรวมตรงที่ ในโลกแห่งความเป็นจริง มีปัญหามากมายที่คุณไม่อาจเก็บข้อมูลรอบๆ ได้ทั้งหมด แต่ต้องใช้วิธีเดา หรือ ‘สันชาตญาณ’ บ้าง ซึ่งเป็นอย่างเดียวกับสิ่งที่ผู้เล่นโป๊กเกอร์ที่ดีต้องมี

อย่างไรก็ตาม ท่ามกลางชัยชนะของวงการปัญญาประดิษฐ์ในครั้งนี้ ก็มีผู้ออกมาแสดงความเห็นว่า ถึงเวลาหรือยังที่เราจะเบนเข็มทั้งวงการให้ไปโฟกัสกับการพัฒนาปัญญาประดิษฐ์ที่ทำงาน ‘ร่วมกับ’ มนุษย์ แทนที่จะทำงาน ‘แข่งขัน’ กับมนุษย์ เพราะนั่นต่างหาก ที่เป็นเป้าหมายของการพัฒนาปัญญาประดิษฐ์ไม่ใช่หรือ

Iyar Rahwan ศาสตราจารย์จาก MIT ให้ความเห็นในเรื่องนี้ไว้ว่า (การพัฒนาปัญญาประดิษฐ์เพื่อทำงานร่วมกับมนุษย์) “นั่นเป็นปัญหาที่สำคัญที่กำลังรอการแก้ไขต่อไป เพราะปัญญาประดิษฐ์ไม่จำเป็นต้องทำงานทดแทนเรา แต่พวกมันต้องอยู่ร่วมกับเราต่างหาก และสิ่งสำคัญที่เราต้องจดจำไว้ก็คือ การปฏิสัมพันธ์กับมนุษย์ส่วนใหญ่นั้นไม่ได้เป็นแบบ ฉันได้-เธอเสีย เธอได้-ฉันเสีย (zero sum) ซึ่งนี่อาจเป็นจุดบอดของการพัฒนาปัญญาประดิษฐ์ในปัจจุบัน”

Digital Ventures x Champ Teepagorn

แห่งวัฒนธรรมชุบแป้งทอด ThaiPBS นักเขียนคอลัมน์ World While Web ณ นิตยสาร a day และ Head in the clouds ณ นิตยสาร GM ถนัดเขียนหนังสือ ชอบวาดการ์ตูน และวาดภาพประกอบ