Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/78389
Title: การค้นคืนหลายรูปแบบของเพลงไทยจากการร้องและการฮัม
Other Titles: Multimodal Retrieval of Thai Music from Singing and Humming
Authors: ขวัญชนก ศิลปพิบูลย์
ณีญาภรณ์ เพชรปาน
Advisors: ศศิภา พันธุวดีธร
ศุภกานต์ พิมลธเรศ
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์
Subjects: เสียง -- การจำแนก
การค้นคืนสารสนเทศ
Sounds -- Classification
Information retrieval
Issue Date: 2562
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: งานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาการค้นคืนหลายรูปแบบของเพลงไทยจากการร้องและการฮัมโดยพิจารณาความเหมือนของลักษณะของเสียงที่สกัดได้จากข้อมูลนำเข้า ได้แก่ เสียงร้องหรือเสียงฮัมขณะที่ผลลัพธ์เป็นชุดเพลงต้นฉบับที่ค้นคืนและเปอร์เซนต์ระดับความมั่นใจ เพลงไทยห้าประเภท ได้แก่ พอป ร็อค แจ๊ส ฮิปฮอป และลูกทุ่งประเภทละ50 เพลง ถูกเลือกมาวิเคราะห์ในการศึกษานี้ ลักษณะของเสียงเจ็ดลักษณะได้แก่ เซนทรอยด์ของสเปกตรัม โรลออฟของสเปกตรัม อัตราการข้ามศูนย์ ความกว้างแถบของสเปกตรัมสัมประสิทธิ์เซปสตรัมความถี่เมล การแปลงฟูเรียร์ช่วงสั้นโครมา และรากกำลังสองเฉลี่ย ได้ถูกนำมาใช้วัดความเหมือนระหว่างเสียงร้องหรือเสียงฮัมเทียบกับเพลงต้นฉบับ นอกจากนี้เทคนิคไดนามิกไทม์วอร์ปปิงได้ถูกนำมาใช้เพื่อศึกษาผลกระทบของการประสานจังหวะเพลงในกระบวนการการเปรียบเทียบ ในท้ายที่สุดชุดเพลงต้นฉบับถูกค้นคืนภายใต้การพิจารณาค่าความเหมือนร่วมกับเกณฑ์การยอมรับและเกณฑ์การปฏิเสธที่ให้เปอร์เซนต์ของระดับความมั่นใจ
Other Abstract: The purpose of this research is to develop multimodal retrieval of Thai music from singing and humming by considering the similarity of audio features that were extracted from input data: singing or humming voice, whereas the output is a set of retrieved original songs with percentage of confidence level. Five types of Thai songs, namely, pop, rock, jazz, hip-hop and folk songs, each of which contains 50 songs, were selected to be analyzed in this study. Seven audio features, i.e., spectral centroid (SPC), spectral roll-off (SRO), zero crossing rate (ZCR), spectral bandwidth (SBW), chroma short-time fourier transform (CHM) and root mean square (RMS), were applied to measure similarity between singing or humming voice and original song. Additionally, the dynamic time warping technique was employed to study the impact of music synchronization in the matching process. Finally, the set of original song was retrieved under the consideration of similarity value together with acceptance and rejection criteria providing the percentage of confidence level.
Description: โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2562
URI: http://cuir.car.chula.ac.th/handle/123456789/78389
Type: Senior Project
Appears in Collections:Sci - Senior Projects

Files in This Item:
File Description SizeFormat 
62-SP-COMSCI-050 - Neeyaporn Pet.pdf1.38 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.