dc.contributor.advisor |
ทวิตีย์ เสนีวงศ์ ณ อยุธยา |
|
dc.contributor.author |
ณัฐนัย สุวรรณชูชิต |
|
dc.contributor.other |
จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ |
|
dc.date.accessioned |
2022-07-23T05:18:00Z |
|
dc.date.available |
2022-07-23T05:18:00Z |
|
dc.date.issued |
2564 |
|
dc.identifier.uri |
http://cuir.car.chula.ac.th/handle/123456789/80127 |
|
dc.description |
วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2564 |
|
dc.description.abstract |
วิทยานิพนธ์นี้นำเสนอแนวทางการสร้างเครื่องมือการทำงานอัตโนมัติเพื่อจำแนกคำถามบนเว็บไซต์สแต็กโอเวอร์โฟลว์ โดยเฉพาะที่เกี่ยวกับชนิดของผลิตภัณฑ์ฐานข้อมูล ซึ่งถือเป็นข้อมูลที่มีค่าสำหรับเจ้าของผลิตภัณฑ์ฐานข้อมูลในการนำไปปรับปรุงผลิตภัณฑ์ หมวดหมู่ของคำถามกำหนดไว้เป็นสองระดับได้แก่ ระดับปัญหา และ ปัญหาย่อย โดยที่ระดับปัญหาประกอบด้วย การพัฒนา การติดตั้ง และ การปรับปรุงประสิทธิภาพ ในขณะที่ ปัญหาย่อย ประกอบด้วย การออกแบบ ข้อจำกัด และการอภิปรายปัญหา ด้วยการรวมทั้งสองระดับเข้าด้วยกัน คำถามจะถูกจำแนกออกเป็นเก้าหมวดของปัญหา-ปัญหาย่อย การประมวลผลภาษาธรรมชาติและการจำแนกข้อความถูกนำมาใช้ โดยใช้อัลกอริทึมการเรียนรู้ของเครื่องที่หลากหลาย โมเดลการจำแนกประเภทที่มีประสิทธิภาพดีที่สุดจะถูกนำมาใช้ในเว็บแอปพลิเคชัน เพื่อจำแนกแต่ละคำถามโดยใช้แท็กปัญหา-ปัญหาย่อย นอกจากนี้คำถามที่ถูกจำแนกออกตามหมวดแล้ว สามารถนำมาวิเคราะห์เพิ่มเติมโดยใช้อัลกอริทึมการสร้างแบบจำลองหัวข้อ เพื่อให้ทราบว่าคำถามในแต่ละหมวดนั้นกล่าวถึงหัวข้อใดบ้าง ซึ่งจะเป็นข้อมูลเพิ่มเติมให้กับเจ้าของผลิตภัณฑ์ฐานข้อมูลในการทำความเข้าใจถึงปัญหาของผลิตภัณฑ์เพื่อจะได้ทำการปรับปรุงต่อไป |
|
dc.description.abstractalternative |
This thesis proposes an automated approach to classifying questions that are posted on Stack Overflow website with regard to a certain kind of database products in particular. Such information is valuable to database product owners for improving their products. The categories of questions are defined at two levels, i.e. problem and subproblem. The problem level includes development, installation, and performance tuning, while the subproblem level consists of design, limitation, and discussion. By cross-combining the two levels, questions can be classified into nine problem-subproblem classes. Natural language processing and text classification are used with several machine learning algorithms. The best classifier for all classes is used in a web application that can classify each question by a problem-subproblem tag. In addition, all classified questions are further analyzed by using a topic modeling algorithm to identify the topics that are addressed in those questions. This will be additional information for a database product owner to understand the issues of the database product for further improvement. |
|
dc.language.iso |
th |
|
dc.publisher |
จุฬาลงกรณ์มหาวิทยาลัย |
|
dc.relation.uri |
http://doi.org/10.58837/CHULA.THE.2021.960 |
|
dc.rights |
จุฬาลงกรณ์มหาวิทยาลัย |
|
dc.subject.classification |
Computer Science |
|
dc.subject.classification |
Computer Science |
|
dc.subject.classification |
Computer Science |
|
dc.subject.classification |
Computer Science |
|
dc.subject.classification |
Computer Science |
|
dc.subject.classification |
Computer Science |
|
dc.title |
การจำแนกปัญหาของเทคโนโลยีฐานข้อมูลในชุมชนถามตอบออนไลน์ |
|
dc.title.alternative |
Classification of database technology problems in online question and answer community |
|
dc.type |
Thesis |
|
dc.degree.name |
วิทยาศาสตรมหาบัณฑิต |
|
dc.degree.level |
ปริญญาโท |
|
dc.degree.discipline |
วิศวกรรมซอฟต์แวร์ |
|
dc.degree.grantor |
จุฬาลงกรณ์มหาวิทยาลัย |
|
dc.identifier.DOI |
10.58837/CHULA.THE.2021.960 |
|