Back to Blogs

ปัญญาประดิษฐ์กับสังเวียนแห่งการเรียนรู้

ตุลาคม 19, 2017 3:40 AM
views
1-1

หลายคนอาจจำภาพยนตร์ปี 2011 ที่มีฮิวจ์ แจ็คแมน รับบทนำ อย่าง Real Steel ได้นะครับ

Real Steel เป็นภาพยนตร์ที่ถึงแม้จะไม่ได้รับคำชื่นชมอะไรจากนักวิจารณ์มาก (59% จากเว็บไซต์ Rotten Tomatoes) แต่ก็ได้รับรายได้ไปพอสมควรเลยทีเดียว (เกือบ 3 ร้อยล้านเหรียญสหรัฐ) เนื้อเรื่องของ Real Steel จะว่าไป ก็คล้ายกับภาพยนตร์ต่อยมวยทั่วๆ ไป คือเล่าถึงการต่อสู้ของ Underdog ที่ดูจะขาดแต้มต่อไปเสียทุกอย่างเมื่อเปรียบเทียบกับฝ่ายตรงข้าม แต่ด้วยความมุ่งมั่น พยายาม ความไม่ย่อท้อ Underdog คนนี้ก็พลิกกลับเอามาเป็นฝ่ายชนะได้ในที่สุด

สิ่งที่ต่างออกไปคือ Real Steel ไม่ได้เป็นภาพยนตร์ต่อยมวยระหว่างคนกับคน แต่เป็นภาพยนตร์ต่อยมวยระหว่างหุ่นยนต์ด้วยกัน ในโลกอนาคต ปี 2020 ของ Real Steel กีฬาต่อยมวยระหว่างมนุษย์ไม่เป็นที่นิยมอีกต่อไป แต่การต่อยระหว่างหุ่นนี่สิ ที่กลายมาเป็นปรากฏการณ์ใหม่ที่จับเอาความสนใจของสาธารณชนไว้ได้อย่างอยู่หมัด

ถึงปัจจุบันจะเป็นปี 2017 ใกล้เคียงกับปี 2020 ที่หนังวาดไว้เข้าทุกที แต่เราก็ไม่เห็นว่าจะมีวี่แววว่าอนาคตแบบในหนังกำลังจะเดินทางมาถึงเลย

แต่ก็ใช่ว่ามันจะไม่เป็นความจริงเสียทีเดียว

เร็วๆ นี้ ศูนย์วิจัยปัญญาประดิษฐ์ที่ก่อตั้งร่วมโดย Elon Musk อย่าง OpenAI ได้เปิดสังเวียนการต่อสู้ระหว่างปัญญาประดิษฐ์ด้วยกันขึ้นมา – โดยพวกเขาจับปัญญาประดิษฐ์สองตัวมาให้เล่นซูโม่แข่งกันในสังเวียนเสมือนจริง – ตั้งชื่อไว้ตรงเป๊ะว่าเป็นเกม RoboSumo

หากคุณได้ดูวิดีโอนักซูโม่ประดิษฐ์พวกนี้แข่งขันกันละก็ คุณอาจคิดว่าไม่น่าตื่นตาตื่นใจอะไรเลย (ดูได้ที่ https://blog.openai.com/competitive-self-play/) ตัวนักซูโม่เองก็เป็นเพียงกราฟิกสามมิติง่ายๆ คล้ายมนุษย์ก้างปลา สังเวียนก็เป็นเพียงบล็อกกลมๆ ที่ไม่ได้ตกแต่งอะไร ดูแล้วอาจจะไม่รู้สึกว่า ‘ล้ำ’ ตรงไหน แต่ความล้ำของ RoboSumo ไม่ได้อยู่ที่ฉากหน้า แต่อยู่ที่วิธีการเรียนรู้ของปัญญาประดิษฐ์ภายในต่างหาก

ปัญญาประดิษฐ์เหล่านี้ไม่ได้ถูก ‘สอน’ ให้ทำอะไรเป็นพิเศษ มันมีร่างกายแบบมนุษย์ แต่นักวิจัยไม่ได้สอนให้มันมีความสามารถอะไรกระทั่งการเดิน พวกเขาเพียงตั้งกฎกติกาไว้ง่ายๆ (เช่น พยายามผลักให้อีกฝ่ายออกนอกวงกลมให้ได้ – เหมือนกติกาซูโม่) ถ้าทำได้จะได้คะแนน แต่ถ้าถูกฝ่ายตรงข้ามผลักออกมาและเป็นฝ่ายแพ้ละก็จะเสียคะแนน เป็นต้น

ผ่านการลองผิดลองถูกนับพันล้านครั้ง พฤติกรรมของปัญญาประดิษฐ์เหล่านี้ก็เริ่มมีส่วนคล้ายมนุษย์ขึ้นมา เช่น พวกมันเรียนรู้ที่จะนั่งยองๆ (สควอท) ให้ตัวเองมีจุดศูนย์ถ่วงต่ำ เพื่อที่ว่าจะได้ล้มได้ยาก (ซึ่งก็เป็นท่าคล้ายๆ กับนักซูโม่จริงๆ) ที่สำคัญกว่านั้นคือพวกมันรู้จักหลอกล่อให้อีกฝ่ายหลงกลด้วย เช่น มันอาจขยับไปที่ริมเวที เพื่อล่อให้อีกฝ่ายชาร์จเข้ามา ก่อนที่จะเอี้ยวตัวหลบให้อีกฝ่ายตกเวทีไปเสีย อย่างที่บอกไว้ก่อนหน้านะครับ – พฤติกรรมพวกนี้ไม่ได้ถูกสอนด้วยการโค้ดโปรแกรมลงไป แต่ปัญญาประดิษฐ์เกิดเรียนรู้เองผ่านกฎของเกม และการลองผิดลองถูก

จะว่าไป ก็คล้ายกับวิวัฒนาการของสัตว์ที่ว่า สัตว์แต่ละประเภทไม่ได้เกิดขึ้นมาเฉลียวฉลาด นกไม่ได้บินได้ตั้งแต่ต้น แมลงไม่รู้จักอำพรางตัว แต่ผ่านการเรียนรู้นับพันๆ หมื่นๆ หรือล้านๆ รุ่น พฤติกรรมที่ ‘ดูชาญฉลาด’ (ซึ่งในที่นี้ก็คือ พฤติกรรมที่ทำให้อยู่รอด) ก็ผุดขึ้นมา

นักวิจัยจาก OpenAI บอกว่า การแข่งขันระหว่างกัน (อย่างเช่นในเกม RoboSumo) นั้นน่าจะมีส่วนช่วยให้ปัญญาประดิษฐ์เกิดการเรียนรู้ได้เร็วกว่าการวิวัฒนาการด้วยตนเอง (โดยปราศจากการแข่งขัน) Maruan Al-Shedivat หนึ่งในนักศึกษาที่ฝึกงานในทีมวิจัยให้สัมภาษณ์กับนิตยสาร Wired ว่า “เมื่อปัญญาประดิษฐ์ต้องมีปฏิสัมพันธ์กับปัญญาประดิษฐ์ตัวอื่น มันก็ต้องรู้จักปรับตัวไปตามสถานการณ์ ไม่เช่นนั้น มันก็จะแพ้”

นอกจากเกม RoboSumo แล้ว OpenAI ก็ยังทดลองใช้เกมลักษณะคล้ายกันเพื่อพัฒนาปัญญาประดิษฐ์ให้มีความสามารถอื่นด้วย เช่น เกมยิงประตูอย่างง่ายๆ ที่ปัญญาประดิษฐ์ฝ่ายหนึ่งต้องเตะลูกบอลให้เข้าโกล ในขณะที่อีกตัวก็ต้องใช้ทุกวิธีปัดป้องลูกบอลไม่ให้เข้าโกล เกมคล้ายๆ ชิงธง ที่ปัญญาประดิษฐ์แต่ละตัวก็ต้องกันไม่ให้อีกตัววิ่งเข้าไปในแดนของตนเองได้ (ซึ่งก็ทำให้พวกมันเรียนรู้แทคติกการเคลื่อนไหวต่างๆ อย่างเช่นการพุ่งชาร์จ หรือการย่อหลบอีกฝ่ายได้)

ที่น่าตื่นเต้นไปกว่านั้นคือ นักวิจัยพบว่าพวกเขาสามารถ ‘ถ่ายทอดบทเรียน’ จากเกมหนึ่งไปสู่สถานการณ์อีกอย่างหนึ่งได้ด้วย เช่น ปัญญาประดิษฐ์ที่รู้จักหลบหลีกอีกฝ่ายจากเกมซูโม่ ก็อาจตอบสนองต่อสถานการณ์จำลองที่นักวิจัยสมมติให้มีลมแรงมากๆ พัดมายังเวทีได้โดยย่อตัวลงเพื่อหลบแรงลมให้มากที่สุด

ข้อจำกัดของงานวิจัยนี้คือสถานการณ์ทั้งหมดยังเป็นเพียงการจำลองในโลกเสมือนจริงเท่านั้น การจะนำบทเรียนที่ปัญญาประดิษฐ์เรียนรู้จากโลกสมมติมาใช้ในโลกจริงนั้นยังคงต้องอาศัยการศึกษาและปรับเปลี่ยนอีกสักระยะ แต่ก็อาจเป็นวิธีการเรียนรู้เช่นนี้เอง ที่จะทำให้เรามีปัญญาประดิษฐ์สารพัดประโยชน์ไว้ใช้ในอนาคต

ส่วนตอนนี้ เราก็คงได้แต่นอนรอโลกอย่างที่ Real Steel วาดไว้ไปก่อน!

Digital Ventures x Champ Teepagorn

แห่งวัฒนธรรมชุบแป้งทอด ThaiPBS นักเขียนคอลัมน์ World While Web ณ นิตยสาร a day และ Head in the clouds ณ นิตยสาร GM ถนัดเขียนหนังสือ ชอบวาดการ์ตูน และวาดภาพประกอบ