Abstract:
การรู้จำตัวเลขเป็นปัญหาสำคัญหนึ่งในสาขาคอมพิวเตอร์วิทัศน์และการรู้จำแบบ งานวิจัยนี้ทำการจำแนกตัวเลขจากฐานข้อมูลเลขที่บ้านจากกูเกิล สตรีตวิว ซึ่งมีความสำคัญต่อการปรับปรุงความถูกต้องของแผนที่และระบบนำทางในปัจจุบัน (Netzer และคณะ, 2012) โดยใช้พารามิเตอร์ที่ได้จากลักษณะเชิงเรขาคณิตวิเคราะห์ของตัวเลขในการสร้างตัวแบบ และใช้ซัพพอร์ตเวกเตอร์แมชชีนในการจำแนกตัวเลข โดยเปรียบเทียบผลลัพธ์การจำแนกตัวเลขระหว่าง 4 เคอร์เนล ได้แก่ เคอร์เนลเชิงเส้น, เคอร์เนลพหุนาม, เคอร์เนลเรเดียล และเคอร์เนลซิกมอยด์ รวมถึงเปรียบเทียบความสำคัญของแต่ละลักษณะว่ามีผลต่อการจำแนกตัวเลขอย่างไร หลังจากเตรียมข้อมูลรูปภาพก่อนการสร้างตัวแบบ ในการดึงลักษณะจะใช้การแปลงฮัฟ (Hough transform) ในการค้นหารูปร่างภาคตัดกรวยที่พบในรูปขอบของตัวเลข 4 รูปแบบ ได้แก่ เส้นตรง, วงรี, พาราโบลาแนวตั้ง และพาราโบลาแนวนอน พบว่า เคอร์เนลเรเดียลให้ผลลัพธ์การจำแนกตัวเลขดีที่สุด คือ 72.17% และใช้เวลาในการสร้างตัวแบบ 22.36 นาที ลักษณะที่เกี่ยวข้องกับเส้นตรงมีความสำคัญต่อการจำแนกตัวเลขมากที่สุด รองลงมาคือ วงรี พาราโบลาแนวนอน และพาราโบลาแนวตั้ง ตามลำดับ