Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/60862
Title: การประเมินแบบจำลองการปกปิดข้อมูลและการใช้กลุ่มตัวจำแนกประเภท
Other Titles: An evaluation of anonymized models and ensemble classifiers
Authors: พีรพงศ์ วาณิชยวิศาลสกุล
Advisors: เกริก ภิรมย์โสภา
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Subjects: ความปลอดภัยในฐานข้อมูล
การป้องกันข้อมูล
Database security
Data protection
Issue Date: 2560
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: งานวิจัยชิ้นนี้ประเมินและวิเคราะห์ประสิทธิภาพของโมเดลความปลอดภัยในการปกปิดข้อมูลและกลุ่มตัวจำแนกประเภทในการจำแนกประเภทชนิดต่างๆ ในปัจจุบันการทำเหมืองข้อมูลถูกใช้งานอย่างต่อเนื่องในจุดประสงค์ต่างๆเพื่อหาองค์ความรู้ การทำเหมืองข้อมูลจำเป็นที่จะต้องคำนึงถึงความเป็นส่วนตัวของข้อมูลที่ใช้สอนโดยที่จะต้องป้องกันไม่ให้สามารถระบุตัวตนข้อมูลในชุดข้อมูลนั้นได้ การปกปิดข้อมูลถูกคิดค้นขึ้นมาโดยมีจุดประสงค์ที่ต้องการจะลดอัตราความเสี่ยงจากการถูกระบุตัวตน อย่างไรก็ตามการปกปิดข้อมูลถูกใช้งานคุณภาพของชุดข้อมูลก็จะลดลง ดังนั้นเราจำเป็นที่จะต้องคำนึงถึงสมดุลระหว่างความปลอดภัยของข้อมูลในการถูกระบุตัวตนและคุณภาพของชุดข้อมูล จุดประสงค์ของงานวิจัยชิ้นนี้คือทำการประเมินผลกระทบของการจำแนกประเภทด้วยข้อมูลที่ถูกปกปิดและประเมินประสิทธิภาพของโมเดลความปลอดภัยและอัลกอริทึ่มกลุ่มตัวจำแนกประเภทต่างๆ มาตรวัดที่จะใช้ในการทดลองคือ ความแม่นยำของการจำแนกประเภท อัตราความเสี่ยงจากการถูกระบุตัวตน และ จำนวนข้อมูลที่ถูกลบ จากผลลัพธ์ที่ได้จากการทดลองสามารถสรุปได้ว่าความแม่นยำของการจำแนกประเภทระหว่างข้อมูลดั้งเดิมและข้อมูลที่ถูกปกปิดไม่ได้แตกต่างกันอย่างมีนัยยะสำคัญ
Other Abstract: We evaluate the performance of privacy models and ensemble classification algorithms for data anonymization on classification. Data mining is continuously used in various purposes to extract knowledge. It is necessary for us to concern about privacy to prevent the result from disclosing identity of persons. Data anonymization has emerged with the objective of reducing re-identification risk. However, when data anonymization is applied, the data utility may decrease. Therefore, it is necessary to trade-off between privacy risks and the data utility. Our objectives in this research are to evaluate the effects of data classification with anonymized data and to evaluate the performance of various privacy models and ensemble classification algorithms. The measurement metrics in this experiment are accuracy, re-identification risk and suppressed records. Our experiments show that there is no significant difference between the accuracy of classification using original data and the accuracy of classification using anonymized data. In addition, the average accuracy of each algorithm is not significantly different.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2560
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/60862
URI: http://doi.org/10.58837/CHULA.THE.2017.1262
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2017.1262
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
5970946421.pdf2.72 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.