Abstract:
กระบวนการรีวิวโค้ดบนกิตฮับ เป็นกระบวนการที่สำคัญกระบวนการหนึ่งในการทำงานบนกิตฮับ โดยนักพัฒนาซอฟต์แวร์จะทำการร้องขอการนำเข้าซอร์สโค้ดหลังจากทำการแก้ไขหรือเปลี่ยนแปลงซอร์สโค้ดเสร็จเรียบร้อยแล้ว ผู้ดูแลระบบจะเป็นผู้รีวิวซอร์สโค้ด โดยพิจารณาถึงคุณภาพ และรายละเอียดทั้งหมดของรายการร้องขอการนำเข้าซอร์สโค้ดนั้น ๆ จากการวิเคราะห์ผลการรีวิว พบว่ามีรายการร้องขอการนำเข้าซอร์สโค้ดจำนวนมาก ที่ไม่ผ่านการรีวิว เนื่องด้วยปัจจัยหลายประการ เช่น ความซับซ้อนของซอร์สโค้ด คุณภาพของซอร์สโค้ด รวมไปถึงจำนวนการเปลี่ยนแปลงไฟล์ เป็นต้น กระบวนการแก้ไขรายการร้องขอการนำเข้าซอร์สโค้ดที่ไม่ผ่านการรีวิวต้องใช้ความพยายาม และเวลาอย่างมากในการแก้ไข ซึ่งอาจส่งผลกระทบกับค่าใช้จ่ายของโครงการ หรือกำหนดการของโครงการได้
งานวิทยานิพนธ์นี้จึงออกแบบ แบบจำลองการทำนายผลการรีวิวโค้ดบนกิตฮับ โดยการวิเคราะห์ข้อมูลบนกิตฮับ กำหนดตัวแปรที่คาดว่าจะมีผลกระทบกับการรีวิวโค้ด รวมถึงการหาความสัมพันธ์ที่เกิดขึ้นบ่อยจากกฎความสัมพันธ์ จากนั้นทำการสร้างแบบจำลองการทำนายการรีวิวโค้ดบนกิตฮับด้วยวิธีการทางสถิติโลจิสติก และหลักการเรียนรู้ด้วยเครื่อง การวิเคราะห์โครงข่ายประสาทเทียมเพอร์เซปตรอนหลายชั้น
ผลการทดลองแสดงสิบรายการร้องขอการนำเข้าซอร์สโค้ดที่พบบ่อยที่สุดในชุดข้อมูล และแบบจำลองการทำนายผลการรีวิวโค้ด โดยแบบจำลองที่ใช้ในการทำนายผลการรีวิวโค้ดที่ใช้การวิเคราะห์โลจิสติกในการวิเคราะห์ข้อมูลมีเปอร์เซ็นต์ความแม่นยำ 89.2307% และแบบจำลองที่ใช้การวิเคราะห์โครงข่ายประสาทเทียมเพอร์เซปตรอนหลายชั้น มีเปอร์เซ็นต์ความแม่นยำ 90.7692%