Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/84448
Title: Dynamic nearest neighbor classifier using mass-ratio-variance outlier factors for class imbalance problem
Other Titles: ตัวแบบจำแนกประเภทเพื่อนบ้านใกล้สุดแบบพลวัตโดยใช้ปัจจัยค่าผิดปกติแมส -เรโช-แวเรียนซ์ สำหรับปัญหาคลาสไม่ดุล
Authors: Patcharasiri Fuangfoo
Advisors: Krung Sinapiromsaran
Other author: Chulalongkorn University. Faculty of Science
Issue Date: 2023
Publisher: Chulalongkorn University
Abstract: The objective of classifcation is to assign a class to a given data instance. One well-recognized classifer is the k-NN model, where the class of an instance is determined by considering the majority class among its k nearest neighbors. However, k-NN’s performance weakens in imbalanced datasets. To address this, adjusting k for each instance based on factors like its position relative to clusters or isolation, and integrating density-based scores from a parameterfree Mass-ratio-variance Outlier Factor (MOF) into the k-NN process, helps determine suitable nearest neighbors. Our research focuses on the development of a dynamic nearest neighbor classifer tailored specifcally to address class imbalance problems. Experimental results on ten real-world datasets show our classifer accurately forecasts outcomes, aligning closely with traditional k-NN with the best parameter k.
Other Abstract: วัตถุประสงค์ของการจำแนกประเภทคือการกำหนดคลาสให้กับข้อมูลให้แม่นยำผ่านตัว จำแนกประเภท หนึ่งในตัวจำแนกประเภทที่เป็นที่รู้จักคือ ตัวแบบเพื่อนบ้านใกล้สุดเค ซึ่งคลาส ของข้อมูลจะถูกกำหนดโดยการพิจารณาคลาสส่วนใหญ่จากกลุ่มตัวอย่าง เค ที่อยู่ใกล้ที่สุด อย่างไรก็ตาม ประสิทธิภาพของตัวแบบเพื่อนบ้านใกล้สุดเคจะลดลงเมื่อชุดข้อมูลที่คลาสไม่ ได้ดุล เพื่อแก้ไขปัญหานี้ ตัวแบบควรใช้ค่าเคที่ต่างกันสำหรับข้อมูลแต่ละตัว ตามตำแหน่งของ ตัวอย่างที่อยู่ในคลัสเตอร์หรือแยกตัวออกมา โดยใช้คะแนนที่คำนวณจากความหนาแน่นเรียก แมส-เรโช-แวเรียนซ์ เอาท์ไลเออร์ แฟคเตอร์(เอ็มโอเอฟ) ที่ไร้พารามิเตอร์ เข้ากับกระบวนการ เพื่อนบ้านใกล้สุดเค ช่วยในการกำหนดเพื่อนบ้านที่เหมาะสม งานวิจัยของเราเน้นการพัฒนาตัวจำแนกประเภทเพื่อนบ้านที่ไดนามิกที่สุดเพื่อแก้ไขปัญหา ความไม่สมดุลของคลาส ผลการทดลองกับข้อมูลจริง 10 ชุดแสดงให้เห็นว่าตัวจำแนกประเภท ที่นำเสนอสามารถทำนายผลได้อย่างแม่นยำ ซึ่งมีความใกล้เคียงกับตัวแบบเพื่อนบ้านใกล้สุดเค โดยใช้พารามิเตอร์ เค ที่ดีที่สุด
Description: Thesis (M.Sc.)--Chulalongkorn University, 2023
Degree Name: Master of Science
Degree Level: Master's Degree
Degree Discipline: Applied Mathematics and Computational Science
URI: https://cuir.car.chula.ac.th/handle/123456789/84448
Type: Thesis
Appears in Collections:Sci - Theses

Files in This Item:
File Description SizeFormat 
6470121923.pdf15.28 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.