Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/58542
Title: การแยกเสียงร้องออกจากเสียงเพลงที่เก็บในช่องสัญญาณเดี่ยวโดยการหาตัวประกอบของเมทริกซ์ค่าไม่เป็นลบ
Other Titles: Singing voice separation for Mono-Channel music using non-negative matrix factorization
Authors: อังคนา จันทร์รุ่งอุทัย
Advisors: โชติรัตน์ รัตนามหัทธนะ
Advisor's Email: Chotirat.R@Chula.ac.th
Subjects: วิศวกรรมเสียง
ดนตรี -- การประมวลผลข้อมูล
เพลง -- การประมวลผลข้อมูล
เพลงร้อง -- การประมวลผลข้อมูล
เสียงพูด -- การประมวลผลข้อมูล
Acoustical engineering
Music -- Data processing
Songs -- Data processing
Vocal music -- Data processing
Voice -- Data processing
Issue Date: 2551
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การแยกเสียงร้องออกจากเสียงเพลง คือ การสกัดเอาเสียงร้องออกมาให้ได้โดยไม่มีเสียงดนตรี หรือให้เหลือน้อยที่สุดเท่าที่จะเป็นไปได้ งานวิจัยหลายด้านเกี่ยวกับเสียงดนตรี เช่น การค้นคืนเพลงในรูปแบบไฟล์ทั่วไป การจับคู่เสียงร้องและเนื้อเพลง การรู้จำเนื้อเพลง และการระบุตัวผู้ร้อง ล้วนมีอุปสรรคที่สำคัญคือเสียงดนตรีที่อยู่ในเพลงนั้น ดังนั้นการแยกเสียงร้องออกจากเสียงเพลงจึงน่าจะมีส่วนช่วยงานวิจัยต่าง ๆ ดังกล่าว โดยเฉพาะอย่างยิ่งการแยกเสียงร้องสำหรับเสียงเพลงในแบบช่องสัญญาณเดี่ยว ซึ่งจะมีผลคือสามารถรองรับได้กับเสียงเพลงในทุกรูปแบบ ไม่ว่าจะเป็นแบบช่องสัญญาณคู่ หรือไฟล์เพลงชนิดอื่น ๆ และจะเพิ่มความเข้าใจเกี่ยวกับองค์ประกอบของเสียงเพลงได้มากยิ่งขึ้นอีกด้วย ความพยายามในการแยกเสียงร้องที่ผ่านมา วิธีที่มีการศึกษาวิจัยในเร็ว ๆ นี้และให้ผลการแยกเสียงที่ดี คือวิธีการวิเคราะห์โสตตามภาวการณ์เชิงคำนวณ แต่ก็ยังคงจำกัดอยู่ที่แนวเพลงบางประเภท งานวิจัยนี้จึงได้นำเสนอถึงวิธีการแยกเสียงร้องออกจากเสียงเพลงสำหรับเพลงในรูปแบบเพิ่มเติม และมีการศึกษาในเชิงวิเคราะห์มากขึ้น โดยใช้ชุดข้อมูลทดลองต่าง ๆ และมาตรวัดแบบอัตราส่วนสัญญาณสูงสุดต่อสัญญาณรบกวน รวมทั้งการวัดค่าความถูกต้องของคอนทัวร์ระดับเสียงที่หาได้ ซึ่งค่าที่ได้จากผลการทดลองต่าง ๆ ให้ผลลัพธ์เป็นที่น่าพอใจ
Other Abstract: Singing voice separation is an extraction of singing voice from a song snippet by minimizing instrumental sounds. Many music related research areas, such as music information retrieval, singing voice and lyrics alignment, lyrics recognition, and singer identification, have been encountered the main obstacle which is the instrumental sound within the song. Removal of such instrumental sound or separation of the singing voice out of the song could be very useful for these research areas. Especially, the singing voice separation for mono-channel music can support any song formats, e.g., stereo music or other types of music file format. Moreover, studying about mono-channel music can provide much better understanding on music components and it characteristics. The recent effort tending to be good for solving this problem is Computational Auditory Scene Analysis (CASA). However, this method is still limited to only some genres of music. This research, therefore, proposes a novel singing voice separation method using Non-negative Matrix Factorization (NMF), a matrix decomposition, for additional types of music by studying some instrumental sounds in greater detail. We use various datasets and measures, peak signal-to-noise ratio (PSNR) and the accuracy of pitch contour extracted from the separated singing voice, to evaluate our proposed work. The satisfactory of our work is confirmed by the experimental results.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2551
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/58542
URI: http://doi.org/10.14457/CU.the.2008.2082
metadata.dc.identifier.DOI: 10.14457/CU.the.2008.2082
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Angkana Chanrungutai.pdf3.13 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.