NVIDIA โชว์ปัญญาประดิษฐ์แปลงข้อความเป็นเสียง ควบคุมได้ระดับร้องเป็นเพลง มีอารมณ์ในน้ำเสียง

NVIDIA สาธิตปัญญาประดิษฐ์แปลงข้อความเป็นเสียง RAD-TTS ที่เคยเปิดตัวในงาน SIGGRAPH’s Real-Time Live จากเดิมที่เคยระบุว่า RAD-TTS สามารถแปลงข้อความเป็นเสียงโดยควบคุมได้อย่างละเอียดทั้งน้ำเสียง, ระยะเวลาเปล่งเสียง, และพลังในการเปล่งเสียง

การสาธิตรอบนี้แสดงให้เห็นว่าปัญญาประดิษฐ์สามารถแปลงเสียงจากโปรดิวเซอร์ให้กลายเป็นเสียงสังเคราะห์โดยยังเก็บน้ำหนักเสียง, อารมณ์ไว้ได้ครบ แม้เสียงที่สังเคราะห์ออกมาจะเป็นคนละเพศกับผู้พูดก็ตามที และเนื่องจากตัวปัญญาประดิษฐ์สร้างเสียงจากข้อความ ทำให้ก่อนสังเคราะห์เสียงเราสามารถปรับแต่งน้ำโทนเสียงให้ต่างจากตอนบันทึกได้ตามต้องการ

การใช้งานปัญญาประดิษฐ์เช่นนี้อาจใช้สำหรับคนพิการ (แบบเดียวกับกูเกิล) หรือใช้สังเคราะห์เสียงในเกมที่ตัวละครสามารถพูดตามบทพูดตามเนื้อเรื่องได้โดยไม่ต้องอาศัยนักแสดงอัดเสียงไว้ล่วงหน้าทุกบทสนทนา

ที่มา – NVIDIA

No Description

from:https://www.blognone.com/node/124542