Digital Ventures

Back to blog

ภาษากับงานศิลปะ

DIGITAL VENTURES X CHAMP TEEPAGORN พฤษภาคม 25, 2018 3:54 AM

4,107

ผมเคยเขียนถึงเรื่องการคิด ‘ภาษา’ เพื่อสื่อสารกันของระบบปัญญาประดิษฐ์ (รวมไปถึงการคิด ‘ภาษาเข้ารหัส’ ระหว่างคู่สนทนาปัญญาประดิษฐ์เพื่อไม่ให้บุคคล (หรือระบบ) ที่สามเข้ามาสอดแทรกหรือล้วงความลับได้) บนพื้นที่นี้แล้วครั้งหนึ่ง แต่ไม่นานมานี้มีการพัฒนาที่น่าสนใจในพื้นที่ร่วมระหว่างภาษากับปัญญาประดิษฐ์ขึ้นอีกครั้ง ความพยายามครั้งนี้น่าสนใจตรงที่เป็นการพยายามลดรูป ‘สิ่งที่ปัญญาประดิษฐ์มองเห็น’ ให้เป็นสัญลักษณ์ คล้ายกับงานศิลปะ ที่ปัญญาประดิษฐ์ระบบอื่นจะเห็นแล้วเข้าใจตรงกัน ซึ่งจะว่าไปก็คล้ายกับระบบตัวอักษรจีน หรือฮีโรกริฟของชาวอียิปต์

เราอาจรู้ว่าตัวอักษรจีนนั้นพัฒนามาจากชุดอักษร Oracle Bone Script ซึ่งเป็นการเขียนข้อความบนหนังสัตว์หรือกระดูกสัตว์ในช่วง 2 สหัสวรรษก่อนคริสตศักราช ตัวอักษรเก่าแก่นี้มีลักษณะคล้ายกับเป็นรูปวาด ตัวอักษรที่แทนความหมายของพระอาทิตย์ ก็มีลักษณะกลมคล้ายกับพระอาทิตย์และมีจุดตรงกลาง หรือตัวอักษรที่แทนความหมายของน้ำ ก็มีลักษณะเป็นเส้นยึกยือแสดงสายน้ำ และมีหยดน้ำพรมอยู่ข้างๆ เมื่อเวลาผ่านไป ตัวอักษรเหล่านี้ก็ผ่านการพัฒนาให้มีระบบระเบียบมากยิ่งขึ้น สามารถทดแทนความหมายเชิงนามธรรมได้ดีขึ้นจนในที่สุดก็กลายมาเป็นตัวอักษรในแบบที่เราเห็นและใช้กันในปัจจุบัน

ระบบตัวอักษรเช่นนี้เรียกว่า Logographic System ซึ่งหมายถึงการใช้ตัวอักษร (Character) เพื่อแทนคำหรือวลี หลักฐานทางประวัติศาสตร์แสดงให้เห็นว่ามีการใช้ระบบตัวอักษรเช่นนี้เป็นส่วนหนึ่งของภาษาทั้งในแอฟริกา จีน และอเมริกากลาง อย่างไรก็ตาม ภาษาที่มีเฉพาะระบบ Logogram ล้วนๆ นั้นคงไม่สามารถใช้งานในชีวิตประจำวันได้อย่างสะดวก (นอกจากภาษาที่มีการประดิษฐ์ขึ้นมา แต่ไม่มีคนใช้ อย่าง Toki Pona ที่ผู้ประดิษฐ์ตั้งใจให้มีคำในภาษาน้อยมากๆ เพียง 120 คำเท่านั้น) ภาษาส่วนมากจึงต้องใช้ Logogram ควบคู่กับตัวขยายหรือส่วนประกอบอื่นๆ เพื่อให้เกิดบทสนทนาและการแลกเปลี่ยนข้อมูลได้อย่างครบถ้วนและมีความหมาย

แล้วทั้งหมดนี้เกี่ยวอะไรกับปัญญาประดิษฐ์?
ไม่นานมานี้ Tom White ศาสตราจารย์ด้านการออกแบบโดยใช้การคำนวณ (Computation Design) ที่วิทยาลัยการออกแบบวิคตอเรีย ได้พัฒนาระบบปัญญาประดิษฐ์ที่สามารถตีความวัตถุให้กลายเป็นสัญลักษณ์แทนความหมายได้ออกมา ผลลัพธ์ที่ได้ดูคล้ายกับงานศิลปะแบบ Abstract โดย Tom White เรียกระบบนี้ว่า “Perception Engine” หรือ “กลไกการรับรู้”

(จากภาพจะเห็นว่าเขาตั้งชื่อแต่รูปล้อเลียนศิลปินชาวเบลเยียมอย่างมากริตต์ จากผลงาน This is not a pipe.)

White เริ่มต้นด้วยการตั้งคำถามว่าเราจะสามารถสร้างภาพนามธรรมจากชุดข้อมูลภาพที่เป็นรูปธรรมได้หรือไม่ เขารู้ว่าในปัจจุบัน เราสามารถให้ปัญญาประดิษฐ์จำแนกรูปภาพและสิ่งของที่อยู่ในรูปได้อย่างถูกต้องแล้ว (เช่น ให้แยกรูปหมากับแมว หรือให้แยกองค์ประกอบว่าในรูปถ่ายมีคนจำนวนกี่คน) แต่สิ่งที่เขาต้องการก็คือ เขาอยากรู้ว่าหากให้ปัญญาประดิษฐ์มองภาพของวัตถุหนึ่งๆ จำนวนมากๆ แล้ว มันจะสามารถหาแก่นหรือแกนร่วมของวัตถุนั้นได้ไหม (เช่น พัดลมไฟฟ้า ต้องมีใบพัด มีแกนหมุนตรงกลาง) เขาออกแบบระบบสามส่วน คือระบบวางแผน ระบบวาด และระบบบรรลุความคิดสร้างสรรค์ ซึ่งทั้งสามระบบจะทำงานร่วมกัน

จุดสำคัญของงานของไวท์อยู่ตรงที่ว่า หลังจากระบบทั้งสามสร้างรูปแอบแสตรกเพื่อแทนค่าวัตถุออกมาได้แล้ว ไวท์จะตรวจสอบรูปดังกล่าวด้วยการนำรูปไปให้ระบบปัญญาประดิษฐ์อื่นๆ ตีความว่ามองเห็นอะไรในรูป โดยปัญญาประดิษฐ์ที่ทำหน้าที่ตัดสิน (เสมือนเป็นผู้ชม) นี้จะไม่มีส่วนเกี่ยวข้องกับการสร้างรูปนั้นขึ้นมาแต่อย่างใด (อย่างไรก็ตาม การตีความในที่นี้จะตรวจสอบโดยผ่านบททดสอบแบบหลายตัวเลือกเท่านั้น ไม่ใช่การตีความโดยอิสระ เหมือนการให้คุณดูรูปแล้วถามว่าคุณเห็นอะไรระหว่างข้อก.ไก่ ถึงข้อง.งู)

ด้วยเหตุที่มีเฉพาะปัญญาประดิษฐ์เท่านั้นที่จะตีความรูปดังกล่าวได้ถูกต้องตรงเผงทั้งหมด (อาจมีคนไม่มากนักที่ดูออกว่าปัญญาประดิษฐ์ตั้งใจวาดรูปหรือสัญลักษณ์อะไร) นิตยสาร FastCompany เรียกงานของ Tom White ว่าเป็น “งานศิลปะโดยปัญญาประดิษฐ์ เพื่อปัญญาประดิษฐ์” ซึ่งตอนนี้งานศิลปะของไวท์ (ร่วมกับปัญญาประดิษฐ์ - เอ๊ะ หรือจะเป็นงานศิลปะของปัญญาประดิษฐ์ร่วมกับไวท์กันแน่?) ก็ออกวางขายในนาม The Treachy of ImageNet บนแพลตฟอร์ม BigCartel (https://dribnet.bigcartel.com/category/the-treachery-of-imagenet)