การสังเคราะห์ข้อความเป็นเสียงพูดภาษาไทย
Loading...
Date
2020
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
มหาวิทยาลัยพะเยา
Abstract
การวิจัยนี้มีวัตถุประสงค์ เพื่อการศึกษาระบบการสังเคราะห์ข้อความให้เป็นเสียงพูดภาษาไทย เป็นระบบที่สามารถสร้างสัญญาณเสียงที่สอดคล้องกับหน่วยเสียงที่ต้องการได้ ในปัจจุบันการสร้างสัญญาณเสียงนั้น อาศัยการบันทึกตัวอย่างสัญญาณเสียงที่สอดคล้องกับหน่วยเสียงทั้งหมดที่จำเป็นในภาษาเอาไว้ หรือมิฉะนั้นก็อาจทำการสร้างแบบจำลองของหน่วยเสียงย่อยทั้งหมดเอาไว้ โดยการเรียนรู้อย่างอัตโนมัติจากตัวอย่างเสียงของมนุษย์จริงเมื่อต้องการสังเคราะห์สัญญาณเสียงที่สอดคล้องกับหน่วยเสียงใดบ้าง ก็นำหน่วยเสียงเหล่านั้นมาต่อกัน หรือสร้างลำดับของหน่วยเสียงที่ต้องการจากแบบจำลองที่ระบบทำการเรียนรู้เอาไว้ และปรับแต่งความต่อเนื่องของเสียงเพื่อให้เสียงมีความเป็นธรรมชาติ จากการทดลองโดยใช้เสียงพูดประโยคภาษาไทยมา Train ข้อมูลให้ระบบจำนวนทั้งสิ้น 2,710 ประโยค ผลการทดลองระบบสามารถสังเคราะห์ข้อความเป็นเสียงพูดภาษาไทยได้ใกล้เคียงกับเสียงพูดต้นฉบับ สามารถปรับปรุงคุณภาพเสียงให้มีประสิทธิภาพในการสังเคราะห์ข้อความเป็นเสียงพูดให้ดีขึ้น โดยการเพิ่มจำนวนชุดข้อมูลกระบวนการเรียนรู้เป็นตัวอย่างประโยคเสียงพูด ระบบการสังเคราะห์ข้อความเป็นเสียงพูดภาษาไทยสามารถแบ่งแยกโทนเสียงพูดของผู้ชายหรือผู้หญิงได้จากการวิเคราะห์ค่าความถี่ของไฟล์เสียงพูดที่นำมาใช้ทดสอบ และจากการอ่านค่ากราฟสเปกโตรแกรม
Description
The purpose of this study was to text to Thai language speech synthesis. Which can create the speech signal to relations with the phoneme that we need. In the present about the create the speech signal depend on the record the example speech signal with relations all the phonemes so necessary in language or maybe we can create the model of all the phonemes to study automatics from speech of human. If you need to speech signal synthesis with relations the phonemes, you can take them to connect together or create the order of the phoneme with the model by learning in the system and adjustments the speech to real and perfect. This experiment reveal that we have taken Thai language speech to train data in system up to 2,710 words. So, the system can language speech synthesis resemble with typescript and we can improve of the quality sounds to complete with we can add some data in learning method the example speech. The Thai language speech synthesis can separate tone’s man or tone’s woman with analyzed frequency and spectrogram.
Keywords
การสังเคราะห์ข้อความเป็นเสียงพูด, ระบบรู้จำเสียงพูด, การเรียนรู้เชิงลึก, Text to Speech Synthesis, Speech Recognition System, Deep Learning
Citation
อภิเดช อุตมะ. (2563). การสังเคราะห์ข้อความเป็นเสียงพูดภาษาไทย. [ปริญญานิพนธ์ไม่ได้ตีพิมพ์]. มหาวิทยาลัยพะเยา.