DSpace Repository

Incorporating context into non-autoregressive model using contextualized CTC for sequence labelling

Show simple item record

dc.contributor.advisor Atiwong Suchato
dc.contributor.advisor Ekapol Chuangsuwanich
dc.contributor.author Burin Naowarat
dc.contributor.other Chulalongkorn University. Faculty of Engineering
dc.date.accessioned 2023-02-03T04:00:33Z
dc.date.available 2023-02-03T04:00:33Z
dc.date.issued 2021
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/81529
dc.description Thesis (M.Eng.)--Chulalongkorn University, 2021
dc.description.abstract Connectionist Temporal Classification (CTC) loss has become widely used in sequence modeling tasks such as Automatic Speech Recognition (ASR) and Handwritten Text Recognition (HTR) due to its ease of use. CTC itself has no architecture constraints, but it is commonly used with recurrent models that predict letters based on histories in order to relax the conditional independent assumption. However, recent sequence models that incorporate CTC loss have been focusing on speed by removing recurrent structures, hence losing important context information. This thesis presents Contextualized Connectionist Temporal Classification (CCTC) loss, which induces prediction dependencies in non-recurrent and non-autoregressive neural networks for sequence modeling. CCTC allows the model to implicitly learn the language model by predicting neighboring labels via multi-task learning. Experiments on ASR and HTR tasks in two different languages show that CCTC models offer improvements over CTC models by 2.2-8.4% relative without incurring extra inference costs.
dc.description.abstractalternative เนื่องจากความง่ายในการใช้งาน คอนเนคชันนิสเทมโปรอลคลาสสิฟิเคชัน (ซีทีซี) จึงถูกนำมา ใช้อย่างแพร่หลายในปัญหาการจําลองตามลําดับอาทิเช่นการรู้จำเสียงพูดอัตโนมัติและการรู้จำตัวอักษร ลายมือเขียน ซีทีซีนั้นสามารถใช้เพื่อฝึกฝนโมเดลโครงข่ายประสาทเทียมแบบใดก็ได้ แต่มักจะถูกใช้คู่กับ โมเดลโครงข่ายประสาทเทียมแบบเกิดซ้ำที่คำนึงถึงผลลัพธ์ในอดีตในการทำนายผลลัพธ์ในปัจจุบันเพื่อ ผ่อนคลายสมมติฐานของความน่าจะเป็นแบบเป็นอิสระของซีทีซี อย่างไรก็ตามงานวิจัยในช่วงหลังสนใจ การใช้งานซีทีซีคู่กับโมเดลแบบไม่เกิดซ้ำโดยมีวัตถุประสงค์ที่จะลดประสิทธิภาพที่เกิดจากความสามารถ ในจากการพึ่งพาบริบทเพื่อเพิ่มความเร็วในการทำนายผล วิทยานิพนธ์นี้ได้เสนอคอนเทคชัวไลซ์คอนเน คชันนิสเทมโปรอลคลาสสิฟิเคชัน (ซีซีทีซี) สำหรับฝึกฝนโมเดลแบบไม่เกิดซ้ำที่ใช้ในปัญหาการจําลอง ตามลําดับ ซีซีทีซีใช้ประโยชน์จากการเรียนรู้หลากหลายงานพร้อมกันในการทำให้โมเดลแบบไม่เกิดซ้ำมี โอกาสที่จะเรียนรู้บริบทสำหรับใช้ในการทำนายผลผ่านการทำนายผลลัพธ์ที่อยู่รอบข้างและการทำนาย ผลลัพธ์หลักไปพร้อมกัน ผลการทดลองในการรู้จำเสียงพูดอัติโนมัติและการรู้จำตัวอักษรลายมือเขียน สำหรับภาษาไทยและอังกฤษแสดงให้เห็นว่าซีซีทีซีมีประสิทธิภาพสัมพัทธ์สูงกว่าซีทีซี 2.2-8.4% โดยที่ ยังสามารถคงความเร็วในการทำนายผลไว้ได้เท่าซีทีซีแบบดั้งเดิม
dc.language.iso en
dc.publisher Chulalongkorn University
dc.relation.uri http://doi.org/10.58837/CHULA.THE.2021.95
dc.rights Chulalongkorn University
dc.subject.classification Computer Science
dc.subject.classification Engineering
dc.subject.classification Engineering
dc.title Incorporating context into non-autoregressive model using contextualized CTC for sequence labelling
dc.title.alternative การผสานบริบทเข้ากับนอนออโตรีเกรสซีฟโมเดลด้วยซีทีซีที่สามารถเรียนรู้บริบทสําหรับการติดป้ายตามลําดับ
dc.type Thesis
dc.degree.name Master of Engineering
dc.degree.level Master's Degree
dc.degree.discipline Computer Engineering
dc.degree.grantor Chulalongkorn University
dc.identifier.DOI 10.58837/CHULA.THE.2021.95


Files in this item

This item appears in the following Collection(s)

Show simple item record