Back to Blogs

เสียงที่เธอไม่เคยได้ยิน : ปัญญาประดิษฐ์กำลังพยายามสร้าง ‘เสียงใหม่’ ที่เป็นการผสมเครื่องดนตรีเข้าด้วยกัน

มิถุนายน 20, 2017 9:15 AM
views
unnamed

ถ้าอยากหวานก็เติมน้ำตาล ถ้าอยากเพิ่มความเค็มอีกสักหน่อย ก็เติมเกลือ และถ้าอยากเพิ่มความเผ็ด จัดจ้าน หรือกลิ่นหอม ก็อาจโรยพริกไทยลงไปในอาหาร การผสมผสานรสชาติเช่นนี้เป็นเรื่องที่เราต่างคุ้นเคยกันอยู่แล้ว อาหารจะอร่อยได้นั้นไม่ได้ขึ้นอยู่กับรสเพียงรสเดียว แต่มักจะเกิดจากการประกอบของหลายรสชาติผสมกัน – เมื่อได้กินอาหารชั้นเลิศ บางคนอาจรำพึงออกมาว่า ‘เหมือนมีวงออเครสตร้าทางรสชาติมาแสดงบนจาน’ ถึงแม้จะดูเว่อร์ไปบ้าง – แต่เราก็คงพอเดาได้นะครับว่าที่เขาพูดมีความหมายว่าอย่างไร

เมื่อพูดถึงประสาทสัมผัสด้านอื่น เช่น การฟัง เราอาจรู้ว่าเสียงของเครื่องดนตรีต่างๆ นั้นมีลักษณะเฉพาะแตกต่างกัน อย่างน้อยๆ ถึงไม่ได้ร่ำเรียนทางด้านดนตรี การแยกระหว่างเสียงเปียโน เสียงเบส กับเสียงกีตาร์ คงไม่ใช่เรื่องยากสำหรับใครหลายคน (แต่ถ้าเป็นการแยกที่ละเอียดอ่อนกว่านั้นเช่นเสียงไวโอลินกับวีโอล่า อาจต้องใช้การฝึกฝนสักหน่อย)

กับอาหาร คุณคงพอจินตนาการได้ว่ารส ‘ระหว่าง’ สองรสชาตินั้นเป็นแบบไหน เช่น รสหวานขมของชอคโกแล็ต รสเค็มหวานของซีอิ๊ว หรือรสเปรี้ยวเค็มของลูกอมรสบ๊วย

แต่คุณเคยคิดไหมครับว่า – ถ้าเอาเสียงเปียโน มาผสมกับเสียงกีตาร์ เสียงที่ออกมาจะหน้าตาเป็นแบบไหน

การ ‘ผสม’ ในที่นี้ไม่ได้หมายความว่า ให้เอาเปียโนกับกีตาร์มาเล่นพร้อมกันนะครับ – แต่หมายถึงว่า ถ้ามีเครื่องดนตรีชนิดหนึ่ง ที่เป็นลูกของเปียโนกับกีตาร์ (ถึงแม้ไม่รู้ว่ามันจะผสมพันธุ์กันยังไงก็เถอะ!) เนี่ย มันจะ ‘ร้อง’ ออกมาด้วยสำเนียงแบบไหน – เมื่อเสียงกรุ๊ง

กริ๊งสดใสของเปียโน ประสานกับเสียงเศร้าๆ เหงาๆ ของกีตาร์ ผลลัพธ์คืออะไร

เราอาจจินตนาการไม่ออก!

โชคดีที่ตอนนี้เราไม่ต้องหวังพึ่งจินตนาการอย่างเดียวอีกต่อไปแล้ว เมื่อ Magenta ซึ่งเป็นทีมเล็กๆ ที่ศึกษาด้านปัญญาประดิษฐ์ของ Google เขาพัฒนาโครงการชื่อว่า NSynth

NSynth เป็นโครงการที่พยายามค้นหา ‘เสียงแบบใหม่’ โดยพวกเขาป้อนแซมเปิลเสียงเครื่องดนตรีนับพันชนิดลงไปใน neural network เพื่อให้ปัญญาประดิษฐ์วิเคราะห์และศึกษาคาแรกเตอร์ของเครื่องดนตรีแต่ละประเภทด้วยโมเดลทางคณิตศาสตร์  เมื่อวิเคราะห์แล้ว NSynth จะสร้าง ‘เวกเตอร์ทางเสียง’ ของเครื่องดนตรีแต่ละชนิดออกมา เวกเตอร์นี้จะช่วยให้โปรแกรมสามารถ ‘เลียนเสียง’ เครื่องดนตรีนั้นๆ ได้อย่างแทบไม่ผิดเพี้ยน

นอกจาก ‘เลียนเสียง’ ธรรมดาแล้ว – เนื่องจากเครื่องดนตรีถูกลดรูปให้เป็นสมการคณิตศาสตร์ – มันจึงยังสามารถจะคำนวณผลลัพธ์จากการ ‘บวก’ สองเครื่องดนตรีเข้าหากันได้ด้วย!

นักวิจัยของ Magenta ทดลองโดยเขียนโปรแกรมเล็กๆ ขึ้นมาให้เราสามารถเลือกผสมเสียงสองเครื่องดนตรีใดๆ ในระดับที่แตกต่างกันได้ ลองนึกถึงแถบสไลเดอร์ที่คุณสามารถเลื่อนซ้ายขวา เมื่อเลื่อนไปทางซ้ายสุด เสียงที่ออกมาจะเป็นเครื่องดนตรีแรก (เช่น เปียโน) และหากเลื่อนไปทางขวาสุด เสียงที่ออกมาจะเป็นเสียงเครื่องดนตรีหลัง (เช่น ฟลุต) คุณสามารถเลือกเลื่อนไว้ตรงกลางเพื่อให้เสียงที่ออกมามีคาแรกเตอร์ของเปียโนกับฟลุตผสมกันพอดีเป๊ะๆ หรืออาจเลือกให้ละเอียดกว่านั้น เช่น ให้มีคาแรกเตอร์ของเปียโน 30% ฟลุต 70% ก็ได้

นอกจากผสมแค่สองเสียงเข้าหากันแล้ว ทีม Magenta ยังไปไกลกว่านั้นด้วยการทดลองผสมสี่เสียงเครื่องดนตรีเข้าหากันผ่านทางอินเตอร์เฟซสองมิติ ซึ่งมีลักษณะคล้ายกราฟที่มีแกน x แกน y แต่ละจุดบนกราฟจะชี้ว่าคาแรกเตอร์ของเครื่องดนตรีแต่ละประเภทจะ ‘ออก’ มาเท่าไหร่

ลองนึกถึงลูกผสมสี่ทางระหว่าง ฟลุต – ออร์แกน – เบส – ฮอร์น สิครับ – แทบนึกไม่ออกเลย! แต่ด้วยเทคโนโลยีก็ทำให้เรานึกออกได้จนได้

การผสมผสานกับระหว่างเสียงของเครื่องดนตรีหลากประเภทนั้นไม่ใช่เรื่องใหม่นัก หากเราพิจารณารวมว่าวงออเครสต้าก็ทำแบบเดียวกันอยู่แล้ว แต่สิ่งที่ต่างออกไปก็คือวงออเครส ตร้านั้นใช้วิธีเล่นเครื่องดนตรีพร้อมกันสองชนิดหรือมากกว่านั้นเพื่อสร้างผลลัพธ์ ขณะที่ปัญญาประดิษฐ์ของ NSynth นั้นไม่ได้เป็น ‘การเล่นพร้อมกัน’ แต่เป็นการผสมเครื่องดนตรีเข้าหากันด้วยวิธีทางคณิตศาสตร์ ซึ่งจากที่ฟังตัวอย่าง ผมก็รู้สึกว่าเสียงออกมาต่างจากการเล่นพร้อมกันธรรมดาๆ จริงๆ

นักวิจัยของทีม Magenta บอกว่า นอกจาก ‘เสียง’ พวกเขาก็ยังหวังว่าจะใช้วิธีเดียวกันนี้ในการขยายขอบเขตทางศิลปะประเภทต่างๆ ให้กว้างขึ้น

ผมเองยังนึกไม่ออกว่ากับศิลปะประเภทอื่น NSynth จะเข้ามาช่วยขยายขอบเขตได้อย่างไร เช่น กับ ‘สี’ เราก็มีการผสมสีระหว่างสองสีหรือมากกว่านั้นเข้าหากันได้อยู่แล้ว (เช่น ขาวบวกแดงเท่ากับชมพูเฉดต่างๆ ตามปริมาณสีขาวและสีแดง) หรือกับกลิ่นก็มีลักษณะคล้ายกัน แต่อย่างไร ผมก็ยังหวังว่าทีม Magenta จะพาเราไปสำรวจขอบเขตใหม่ๆ ของวงการศิลปะอย่างที่ว่าไว้ได้จริง เพราะนี่อาจทำให้เราได้เห็น ‘สีที่ไม่เคยเห็น’ ‘กลิ่นที่ไม่เคยดม’ ‘สัมผัสที่ไม่เคยสัมผัสมาก่อน’ เพิ่มเติมไปจาก ‘เสียงที่คุณไม่เคยได้ยิน’

ลองไปฟังเสียงเครื่องดนตรีต่างๆ ผสมผสานกันได้ที่หน้างานวิจัย https://magenta.tensorflow.org/nsynth

Digital Ventures x Champ Teepagorn

แห่งวัฒนธรรมชุบแป้งทอด ThaiPBS นักเขียนคอลัมน์ World While Web ณ นิตยสาร a day และ Head in the clouds ณ นิตยสาร GM ถนัดเขียนหนังสือ ชอบวาดการ์ตูน และวาดภาพประกอบ