Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/44408
Title: การปรับปรุงคุณภาพสำหรับวีดิทัศน์ภาษามือ H.264 ผ่านการส่งแบบไร้สายอัตราบิตต่ำ
Other Titles: QUALITY IMPROVEMENT FOR H.264 SIGN LANGUAGE VIDEO OVER LOW BIT-RATE WIRELESS TRANSMISSION
Authors: ศิรวิชญ์ สุบงกช
Advisors: สุภาวดี อร่ามวิทย์
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Supavadee.A@Chula.ac.th,supavadee.aaa@gmail.com
Subjects: ภาษามือ
เอ็มเพ็ก
แบบจำลองทางภาษาศาสตร์
Sign language
MPEG (Video coding standard)
Linguistic models
Issue Date: 2557
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: สำหรับคนหูหนวก ภาษามือถูกใช้เป็นวิธีหลักในการติดต่อสื่อสารแทนการสื่อสารด้วยวาจา ด้วยความก้าวหน้าของเทคโนโลยีจึงเป็นเรื่องธรรมดาที่จะเห็นบริการโทรศัพท์วีดิทัศน์หรือการประชุมทางวีดิทัศน์ที่คนหูหนวกสามารถใช้บริการเหล่านี้สำหรับการติดต่อสื่อสารโดยใช้การแสดงท่าภาษามือระหว่างกัน อย่างไรก็ตามวีดิทัศน์ที่มีการส่งผ่านโครงข่ายทั้งแบบมีสายหรือไร้สายที่มีความกว้างของช่องสัญญาณต่ำและง่ายต่อการเกิดข้อผิดพลาด การเสื่อมของคุณภาพเป็นสิ่งที่หลีกเลี่ยงไม่ได้ ภาพที่บกพร่องนี้ทำให้การแปลความหมายที่ถูกต้องแทบจะเป็นไปไม่ได้เลย ในวิทยานิพนธ์นี้ ผลงานซึ่งประกอบด้วยวิธีการสามแบบถูกนำเสนอด้วยจุดมุ่งหมายเพื่อสร้างวีดิทัศน์ที่ต้านทานต่อความผิดพลาด ลดผลกระทบของการแพร่กระจายความผิดพลาดและเพื่อนำเสนอวิธีการจัดสรรบิตที่เหมาะสมสำหรับวีดิทัศน์ภาษามือ วิธีในลำดับแรกแผนการคืนสภาพมาโครบล็อกภายในถูกนำเสนอร่วมกับแบบจำลองทางภาษา ข้อมูลป้อนกลับและบิตเป้าหมายเพื่อคำนวณจำนวนมาโครบล็อกภายในที่เหมาะสมต่อเฟรม การคืนสภาพมาโครบล็อกภายในถูกจัดสรรในบริเวณใบหน้า มือและลำตัว ลำดับที่สองการจัดเรียงมาโครบล็อกแบบยืดหยุ่นได้ถูกใช้ในการจัดสรรมาโครบล็อกเข้าสู่กลุ่มสไลซ์ที่แตกต่างกันตามแบบจำลองทางภาษาเพื่อลดความน่าจะเป็นที่มาโครบล็อกที่สำคัญจะเกิดการสูญหาย ในลำดับที่สามการปรับปรุงการควบคุมอัตราบิตในระดับเฟรมและมาโครบล็อกถูกนำเสนอเพื่อการจัดสรรบิตที่ชาญฉลาดเพื่อเพิ่มความชัดเจนในการแปลความหมายของวีดิทัศน์ภาษามือที่ถูกเข้ารหัส ผลการทดลองถูกประเมินคุณภาพในเชิงปรวิสัยและความชัดเจนในการแปลความหมาย ผลการทดลองแสดงให้เห็นว่าวิธีที่นำเสนอสามารถปรับปรุงคุณภาพของวีดิทัศน์ภาษามือที่ถูกบีบอัดได้อย่างมีนัยสำคัญและสามารถเพิ่มความชัดเจนในการแปลความหมายในการสนทนาวีดิทัศน์ภาษามือได้เป็นอย่างดี
Other Abstract: For the Deaf people, Sign language is used as a primary mode of their communication, in place of verbal communication. With technology advancement, it is common to see video phone and video conference services where deaf can utilize these services for their signing communication. However as video has to transmit over low bandwidth and error prone wired or wireless network, the quality degradation is inevitably expected. With impaired images, the accurate interpretation is not possible. In this thesis, three contribution are presented with the aim to make the video more resilient to error, to reduced effects of error propagation, and to propose suitable bit allocation method for signing video. Firstly, an intra macroblock refresh scheme is proposed. By incorporating linguistic model, feedback information, and target bits, the optimal number of macroblocks per frame is computed. The intra refresh macroblock are assigned in face, hand, and body region. Secondly, flexible macroblock ordering is used to by assigning macroblocks to different slice groups based on linguistic model to reduce the probability that important macroblock will be lost. Lastly, improved frame layer and macroblock layer rate control are proposed to intelligently allocate bit to increase intelligibility of coded signing videos. The experimental results are evaluated in terms of objective quality and intelligibility and showed that the proposed method can significantly improve compressed signing video quality and can increase intelligibility in signing video conversation as well.
Description: วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2557
Degree Name: วิศวกรรมศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิศวกรรมไฟฟ้า
URI: http://cuir.car.chula.ac.th/handle/123456789/44408
URI: http://doi.org/10.14457/CU.the.2014.472
metadata.dc.identifier.DOI: 10.14457/CU.the.2014.472
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
5370674121.pdf3.65 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.