DSpace Repository

การจำแนกปัญหาของเทคโนโลยีฐานข้อมูลในชุมชนถามตอบออนไลน์

Show simple item record

dc.contributor.advisor ทวิตีย์ เสนีวงศ์ ณ อยุธยา
dc.contributor.author ณัฐนัย สุวรรณชูชิต
dc.contributor.other จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
dc.date.accessioned 2022-07-23T05:18:00Z
dc.date.available 2022-07-23T05:18:00Z
dc.date.issued 2564
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/80127
dc.description วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2564
dc.description.abstract วิทยานิพนธ์นี้นำเสนอแนวทางการสร้างเครื่องมือการทำงานอัตโนมัติเพื่อจำแนกคำถามบนเว็บไซต์สแต็กโอเวอร์โฟลว์ โดยเฉพาะที่เกี่ยวกับชนิดของผลิตภัณฑ์ฐานข้อมูล ซึ่งถือเป็นข้อมูลที่มีค่าสำหรับเจ้าของผลิตภัณฑ์ฐานข้อมูลในการนำไปปรับปรุงผลิตภัณฑ์ หมวดหมู่ของคำถามกำหนดไว้เป็นสองระดับได้แก่ ระดับปัญหา และ ปัญหาย่อย โดยที่ระดับปัญหาประกอบด้วย การพัฒนา การติดตั้ง และ การปรับปรุงประสิทธิภาพ ในขณะที่ ปัญหาย่อย ประกอบด้วย การออกแบบ ข้อจำกัด และการอภิปรายปัญหา ด้วยการรวมทั้งสองระดับเข้าด้วยกัน คำถามจะถูกจำแนกออกเป็นเก้าหมวดของปัญหา-ปัญหาย่อย การประมวลผลภาษาธรรมชาติและการจำแนกข้อความถูกนำมาใช้ โดยใช้อัลกอริทึมการเรียนรู้ของเครื่องที่หลากหลาย โมเดลการจำแนกประเภทที่มีประสิทธิภาพดีที่สุดจะถูกนำมาใช้ในเว็บแอปพลิเคชัน เพื่อจำแนกแต่ละคำถามโดยใช้แท็กปัญหา-ปัญหาย่อย นอกจากนี้คำถามที่ถูกจำแนกออกตามหมวดแล้ว สามารถนำมาวิเคราะห์เพิ่มเติมโดยใช้อัลกอริทึมการสร้างแบบจำลองหัวข้อ เพื่อให้ทราบว่าคำถามในแต่ละหมวดนั้นกล่าวถึงหัวข้อใดบ้าง ซึ่งจะเป็นข้อมูลเพิ่มเติมให้กับเจ้าของผลิตภัณฑ์ฐานข้อมูลในการทำความเข้าใจถึงปัญหาของผลิตภัณฑ์เพื่อจะได้ทำการปรับปรุงต่อไป
dc.description.abstractalternative This thesis proposes an automated approach to classifying questions that are posted on Stack Overflow website with regard to a certain kind of database products in particular. Such information is valuable to database product owners for improving their products. The categories of questions are defined at two levels, i.e. problem and subproblem. The problem level includes development, installation, and performance tuning, while the subproblem level consists of design, limitation, and discussion. By cross-combining the two levels, questions can be classified into nine problem-subproblem classes. Natural language processing and text classification are used with several machine learning algorithms. The best classifier for all classes is used in a web application that can classify each question by a problem-subproblem tag. In addition, all classified questions are further analyzed by using a topic modeling algorithm to identify the topics that are addressed in those questions. This will be additional information for a database product owner to understand the issues of the database product for further improvement. 
dc.language.iso th
dc.publisher จุฬาลงกรณ์มหาวิทยาลัย
dc.relation.uri http://doi.org/10.58837/CHULA.THE.2021.960
dc.rights จุฬาลงกรณ์มหาวิทยาลัย
dc.subject.classification Computer Science
dc.subject.classification Computer Science
dc.subject.classification Computer Science
dc.subject.classification Computer Science
dc.subject.classification Computer Science
dc.subject.classification Computer Science
dc.title การจำแนกปัญหาของเทคโนโลยีฐานข้อมูลในชุมชนถามตอบออนไลน์
dc.title.alternative Classification of database technology problems in online question and answer community
dc.type Thesis
dc.degree.name วิทยาศาสตรมหาบัณฑิต
dc.degree.level ปริญญาโท
dc.degree.discipline วิศวกรรมซอฟต์แวร์
dc.degree.grantor จุฬาลงกรณ์มหาวิทยาลัย
dc.identifier.DOI 10.58837/CHULA.THE.2021.960


Files in this item

This item appears in the following Collection(s)

Show simple item record