Back to Blogs

ความเห็นแก่ตัวของปัญญาประดิษฐ์ หรือ AI

มีนาคม 15, 2017 4:16 AM
views
are-ai-machine-selfish-01

เมื่อเราพูดถึงปัญญาประดิษฐ์ เรามักจะคิดว่ามันเป็น ‘ปัญญา’ กลางๆ ที่ไม่ได้มีความดีหรือความชั่วในตัวเอง เรามักคิดว่าปัญญาประดิษฐ์เป็นเพียงสิ่งที่ไม่มีชีวิตจิตใจ เป็นแค่ของทั่วไปเหมือนกับก้อนหิน หรือแก้วน้ำสักใบ ฉะนั้น เมื่อเราบอกว่าปัญญาประดิษฐ์นั้นมี ‘ความเห็นแก่ตัว’ หรือ ‘ความเห็นแก่ผู้อื่น’ จึงฟังดูแปลกอย่างช่วยไม่ได้

ถึงจะพูดอย่างนั้น การทำความเข้าใจปัญญาประดิษฐ์ โดยเฉพาะในระดับที่สูงขึ้น (จนมนุษย์ไม่สามารถเข้าใจการทำงานของมันได้อย่างเป็นขั้นตอน เพราะมันใช้วิธีการเรียนรู้ที่คล้ายคลึงกับสมองมนุษย์) ก็เป็นความจำเป็นอย่างยิ่ง โดยเฉพาะเมื่อเราคิดว่าโลกของเรากำลังสอดประสานและถูกควบคุมด้วยปัญญาประดิษฐ์มากขึ้นเรื่อยๆ ตั้งแต่สิ่งที่พอเห็นทั่วไปและจับต้องได้เช่นการควบคุมการจราจร ไปจนถึงเรื่องที่ซับซ้อนและเกี่ยวพันกับศีลธรรมมากขึ้น อย่างเช่นการเป็น ‘ลูกขุนอิเล็กทรอนิกส์’

หน่วยงานย่อยของ Google ที่ทำหน้าที่ศึกษาวิจัยและพัฒนาปัญญาประดิษฐ์โดยเฉพาะอย่าง DeepMind นั้นตั้งคำถามเกี่ยวกับเรื่องนี้ได้อย่างน่าสนใจมากครับ – พวกเขาสงสัยว่า ถ้าเราปล่อยปัญญาประดิษฐ์หลายๆ ตัว ไปทำงานชนิดเดียวกัน พวกมันจะร่วมมือกัน หรือขัดขากันเอง เพื่อให้งานของตนประสบความสำเร็จมากที่สุด

หลายคนคงเคยได้ยินปริศนาที่เรียกว่า Prisoner’s Dilemma หรือทางเลือกของนักโทษ  ซึ่งมักถูกนำมาใช้อธิบายสถานการณ์ที่หากแต่ละคนปฏิบัติตนอย่างเห็นแก่ตัว ก็จะเป็นผลดีกับตัวเองในระดับหนึ่ง แต่หากทุกคนปฏิบัติแบบเห็นแก่ตัวทั้งหมด ก็จะเกิดผลเสียกับทุกคน – กรณีแบบนี้เองที่ Deepmind พยายามทำความเข้าใจว่าปัญญาประดิษฐ์จะ ‘ฉลาด’ พอที่จะร่วมมือกันหรือไม่ หรือจะ ‘ฉลาดเกินไป’ จนทำร้ายกันเองไปเลย?

k-champ-deepmind

การทดลองของ DeepMind มีขั้นตอนที่สนุกมากครับ – พวกเขาเซตอัพ ‘เกม’ ย่อยๆ ขึ้นมาสองเกม

เกมแรกมีชื่อว่า Gathering (หรือ การเก็บเกี่ยว) ในเกมนี้ ทีมเซตอัพกติกาขึ้นมาให้ปัญญาประดิษฐ์สองตัวแข่งกันเก็บแอปเปิ้ล (แอปเปิ้ลดิจิทัลนะครับ) โดยจะตัดสินคะแนนจากจำนวนแอปเปิ้ลที่แต่ละตัวเก็บได้ แต่มีกติกาพิเศษเพิ่มเติมตรงที่ทั้งสองตัวมีออปชั่นที่จะ ‘ช็อต’ (Zap) อีกฝ่าย เพื่อให้อีกฝ่ายหายจากฉากไปชั่วขณะ เพื่อที่ว่าตัวเองจะได้เก็บแอปเปิ้ลได้สะดวกมากขึ้นได้ด้วย

ในกรณีนี้ จะไม่เข้าข่าย Prisoner’s Dilemma อย่างที่ว่ามาตอนต้นนักนะครับ แต่จะเข้าข่ายว่าเป็น Zero-sum Game คือยิ่งคู่ต่อสู้ทำได้น้อยเท่าไหร่ เราก็จะยิ่งทำคะแนนได้มากขึ้นเท่านั้น

ในเกม Gathering นักวิจัยพบว่า เมื่อกำหนดให้จำนวนแอปเปิ้ลกองกลางมีมากพอ ปัญญาประดิษฐ์ทั้งสองจะไม่ช็อตกันเอง แต่จะพุ่งเป้าไปที่การเก็บแอปเปิ้ลอย่างเดียวเท่านั้น แต่เมื่อไรก็ตามที่จำนวนแอปเปิ้ลน้อย ปัญญาประดิษฐ์ก็จะช็อตกันเองมากขึ้นเรื่อยๆ สิ่งที่น่าสังเกตอีกอย่างหนึ่งก็คือ ปัญญาประดิษฐ์ที่ ‘ฉลาดกว่า’ จะเลือกช็อตคู่ต่อสู้ ไม่ว่าจะมีแอปเปิ้ลมากหรือน้อยก็ตาม

ทำไมถึงเป็นอย่างนั้น? นักวิจัยเขาพยายามให้เหตุผลว่า เพราะว่าการคำนวณว่าจะไปวิ่งไล่ตามปัญญาประดิษฐ์อีกตัวเพื่อไฟช็อตนั้น ใช้พลังในการประมวลผลมาก ดังนั้นปัญญาประดิษฐ์ที่มีความซับซ้อนน้อยกว่า จึงคิดว่านี่เป็นทางเลือกที่ไม่คุ้ม (เพราะต้องเสียเวลาในการเก็บแอปเปิ้ลไปมาก) แต่ปัญญาประดิษฐ์ที่ซับซ้อนกว่าจะสามารถคำนวณการวิ่งไล่ตามเพื่อช็อตได้อย่างรวดเร็ว ทำให้เป็นทางเลือกที่ไม่มีต้นทุนมากนัก

เกมที่สองมีชื่อว่า Wolf Pack กติกาคือปัญญาประดิษฐ์สองตัวจะต้องล่าเหยื่อในสภาพแวดล้อมที่มีสิ่งกีดขวางวางอยู่ทั่วไป ในเกมนี้จะมีระบบการให้คะแนนต่างไปจากเกมแรกตรงที่ เมื่อมีผู้จับเหยื่อได้ คะแนนจะถูกแจกจ่ายให้กับผู้เล่นใกล้ๆ เหยื่อนั้นด้วย

ในเกมนี้ นักวิจัยพบว่าปัญญาประดิษฐ์เรียนรู้ที่จะร่วมมือกันเพื่อให้ได้คะแนนมากที่สุด และสิ่งที่ต่างออกไปยิ่งขึ้นคือ ยิ่งปัญญาประดิษฐ์ฉลาดมากขึ้นเท่าไหร่ มันก็จะยิ่งร่วมมือกับปัญญาประดิษฐ์อื่นมากขึ้นเท่านั้น

นักวิจัยจึงสรุปผลการทดลองทั้งหมดว่า ปัญญาประดิษฐ์จะประพฤติตนอย่างไร ก็ขึ้นอยู่กับแรงจูงใจในเกมนั้นๆ นั่นคือ หากเกมให้ความสำคัญกับผลลัพธ์รายบุคคลและไม่ส่งเสริมให้เกิดการร่วมมือกัน ยิ่งปัญญาประดิษฐ์ฉลาดมันก็จะยิ่งทำร้ายผู้อื่นมากขึ้น ยิ่งเห็นแก่ตัวมากขึ้น แต่ถ้าเป็นสถานการณ์ที่ส่งเสริมให้เกิดความร่วมมือกันเพื่อผลลัพธ์ที่ดีที่สุด ปัญญาประดิษฐ์ก็ฉลาดพอที่จะทำงานร่วมกัน สิ่งที่น่าศึกษาต่อไปในอนาคตก็คือเรื่องนี้นั่นเองครับ – ว่าเราจะสร้างสภาพแวดล้อมแบบไหนกันดี ที่จะส่งเสริมให้เกิดความร่วมมือกัน มากกว่าที่จะแข่งขันกันเพื่อผลประโยชน์ส่วนตน

นั่นคือเราต้องสร้างแรงจูงใจ หรือการวัดผลที่ไป ‘นับ’ การร่วมมือกัน มากกว่าผลลัพธ์เชิงปัจเจก

เมื่อลองดูผลการศึกษาครั้งนี้ เราก็อาจพบว่านอกจากมันจะใช้กับการพัฒนาปัญญาประดิษฐ์ได้แล้ว – มันก็ยังใช้กับการวางสภาพแวดล้อมเพื่อพัฒนาคนได้ด้วย

Digital Ventures x Champ Teepagorn

แห่งวัฒนธรรมชุบแป้งทอด ThaiPBS นักเขียนคอลัมน์ World While Web ณ นิตยสาร a day และ Head in the clouds ณ นิตยสาร GM ถนัดเขียนหนังสือ ชอบวาดการ์ตูน และวาดภาพประกอบ