การสังเคราะห์ข้อความเป็นเสียงพูดภาษาไทย

อภิเดช อุตมะ

การสังเคราะห์ข้อความเป็นเสียงพูดภาษาไทย

Files

ติดต่อ งานส่งเสริมการเรียนรู้สารสนเทศดิจิทัล.pdf(46.82 KB)

Date

2020

Authors

อภิเดช อุตมะ

Publisher

มหาวิทยาลัยพะเยา

Abstract

การวิจัยนี้มีวัตถุประสงค์ เพื่อการศึกษาระบบการสังเคราะห์ข้อความให้เป็นเสียงพูดภาษาไทย เป็นระบบที่สามารถสร้างสัญญาณเสียงที่สอดคล้องกับหน่วยเสียงที่ต้องการได้ ในปัจจุบันการสร้างสัญญาณเสียงนั้น อาศัยการบันทึกตัวอย่างสัญญาณเสียงที่สอดคล้องกับหน่วยเสียงทั้งหมดที่จำเป็นในภาษาเอาไว้ หรือมิฉะนั้นก็อาจทำการสร้างแบบจำลองของหน่วยเสียงย่อยทั้งหมดเอาไว้ โดยการเรียนรู้อย่างอัตโนมัติจากตัวอย่างเสียงของมนุษย์จริงเมื่อต้องการสังเคราะห์สัญญาณเสียงที่สอดคล้องกับหน่วยเสียงใดบ้าง ก็นำหน่วยเสียงเหล่านั้นมาต่อกัน หรือสร้างลำดับของหน่วยเสียงที่ต้องการจากแบบจำลองที่ระบบทำการเรียนรู้เอาไว้ และปรับแต่งความต่อเนื่องของเสียงเพื่อให้เสียงมีความเป็นธรรมชาติ จากการทดลองโดยใช้เสียงพูดประโยคภาษาไทยมา Train ข้อมูลให้ระบบจำนวนทั้งสิ้น 2,710 ประโยค ผลการทดลองระบบสามารถสังเคราะห์ข้อความเป็นเสียงพูดภาษาไทยได้ใกล้เคียงกับเสียงพูดต้นฉบับ สามารถปรับปรุงคุณภาพเสียงให้มีประสิทธิภาพในการสังเคราะห์ข้อความเป็นเสียงพูดให้ดีขึ้น โดยการเพิ่มจำนวนชุดข้อมูลกระบวนการเรียนรู้เป็นตัวอย่างประโยคเสียงพูด ระบบการสังเคราะห์ข้อความเป็นเสียงพูดภาษาไทยสามารถแบ่งแยกโทนเสียงพูดของผู้ชายหรือผู้หญิงได้จากการวิเคราะห์ค่าความถี่ของไฟล์เสียงพูดที่นำมาใช้ทดสอบ และจากการอ่านค่ากราฟสเปกโตรแกรม

Description

The purpose of this study was to text to Thai language speech synthesis. Which can create the speech signal to relations with the phoneme that we need. In the present about the create the speech signal depend on the record the example speech signal with relations all the phonemes so necessary in language or maybe we can create the model of all the phonemes to study automatics from speech of human. If you need to speech signal synthesis with relations the phonemes, you can take them to connect together or create the order of the phoneme with the model by learning in the system and adjustments the speech to real and perfect. This experiment reveal that we have taken Thai language speech to train data in system up to 2,710 words. So, the system can language speech synthesis resemble with typescript and we can improve of the quality sounds to complete with we can add some data in learning method the example speech. The Thai language speech synthesis can separate tone’s man or tone’s woman with analyzed frequency and spectrogram.

Keywords

การสังเคราะห์ข้อความเป็นเสียงพูด, ระบบรู้จำเสียงพูด, การเรียนรู้เชิงลึก, Text to Speech Synthesis, Speech Recognition System, Deep Learning

Citation

อภิเดช อุตมะ. (2563). การสังเคราะห์ข้อความเป็นเสียงพูดภาษาไทย. [ปริญญานิพนธ์ไม่ได้ตีพิมพ์]. มหาวิทยาลัยพะเยา.

URI

https://updc.up.ac.th/handle/123456789/1122

Collections

คณะวิทยาศาสตร์

Full item page