Abstract:
ความสำคัญและที่มา: จำนวนของผลบวกลวง (false positive) ปริมาณมากที่เกิดขึ้นในการส่องลำไส้ใหญ่โดยใช้ระบบคอมพิวเตอร์ปัญญาประดิษฐ์ช่วยในการ หาติ่งเนื้อลำไส้อาจทำให้แพทย์ผู้ทำการส่องกล้องเกิดความรำคาญ เสียสมาธิในการส่องกล้อง เสียเวลามากขึ้นในการเข้าไปตรวจเช็คซ้ำบริเวณที่มีกรอบขึ้น ทำให้ใช้เวลาในการ ส่องกล้องลำไส้ใหญ่นานขึ้น อย่างไรก็ตาม การปรับค่าเกณฑ์ชี้วัดที่ช่วยลดบวกลวงทำให้ความไวและความถูกต้องของประสิทธิภาพของระบบคอมพิวเตอร์ปัญญาประดิษฐ์ในการ ตรวจพบติ่งเนื้อลำไส้ใหญ่ลดลง วัตถุประสงค์: เพื่อเปรียบเทียบประสิทธิภาพระหว่างระบบคอมพิวเตอร์ปัญญาประดิษฐ์2 ระบบคือ CAD EYE และ Deep-GI ในการการช่วยตรวจจับติ่งเนื้อ ลำไส้ใหญ่ในผู้ที่มาส่องกล้องคัดกรองมะเร็งลำไส้ใหญ่ และหาค่าเกณฑ์ชี้วัดที่เหมาะสมเพื่อลดอัตราการเกิดผลบวกลวง ระเบียบวิธีการวิจัย: ระบบ Deep-GI ได้ถูกพัฒนาขึ้น โดยใช้กระบวนการเรียนรู้เชิงลึกของคอมพิวเตอร์บน Model ทางวิศวกรรมศาสตร์ชื่อ YOLOv5 deep learning framework ซึ่งมีการใช้ข้อมูลตัวอย่างในการพัฒนา Deep-GI ถึง 15,188 ภาพ และใช้ในการทดสอบอีก 1,520 ภาพ เมื่อเริ่มทำการศึกษา จะมีการบันทึก วีดีโอขณะกำลังถอยกล้องตรวจดูลำไส้ใหญ่ ทั้งวีดีโอที่มีระบบ CAD EYE (CAD EYETM ; Fujifilm, Tokyo, Japan) และ วีดีโอที่นำระบบ Deep-GI มาใส่เข้าไปภายหลัง หลังจาก นั้น วีดีโอที่มีระบบคอมพิวเตอร์ปัญญาประดิษฐ์ทั้ง 2 วีดีโอ จะถูกตรวจสอบและบันทึกข้อมูลต่าง ๆ โดยอายุรแพทย์ทางเดินอาหารที่มีความเชี่ยวชาญด้านการส่องกล้องลำไส้ ใหญ่ 2 คน ข้อมูลใดที่มีความเห็นไม่ตรงกันจะถูกตรวจสอบซ้ำโดยอายุรแพทย์ทางเดินอาหารที่มีความเชี่ยวชาญพิเศษ ผลบวกจริง (true positive) คือ การที่ปัญญาประดิษฐ์ขึ้น กรอบเตือนว่ามีติ่งเนื้อในบริเวณที่มีติ่งเนื้อจริง หลังจากแพทย์ตรวจสอบวีดีโลและบันทึข้อมูลแล้ว จะนำข้อมูลต่าง ๆ เช่น อัตราการพบติ่งเนื้อลำไส้ใหญ่ (polyp detection rate), อัตราการไม่พบติ่งเนื้อลำไส้ใหญ่ (polyp miss rate) และอัตราการพบผลบวกลวง (false positive rate) มาคำนวณเปรียบเทียบประสิทธิภาพของระบบคอมพิวเตอร์ ปัญญาประดิษฐ์ทั้ง 2 ระบบโดยเปรียบเทียบในหลายๆเกณฑ์ชี้วัด ทั้งเกณฑ์ชี้วัด ≥ 0.5 วินาที, ≥ 1 วินาที, ≥ 1.5 วินาทีและ ≥ 2 วินาที ผลการวิจัย: จากผู้ป่วยที่มาส่องกล้องเพื่อคัดกรองมะเร็งลำไส้ใหญ่ทั้งหมด 170 ราย พบว่า มีผู้ป่วย 137 รายที่ส่องกล้องพบติ่งเนื้อลำไส้ใหญ่อย่างน้อย 1 ติ่ง เนื้อ โดยมีค่าเฉลี่ยระยะเวลาในการถอยกล้องเท่ากับ 7.8 ± 2.7 นาทีจากผู้ป่วย 137 ราย พบติ่งเนื้อลำไส้ใหญ่ทั้งหมด 501 ติ่งเนื้อ แบ่งเป็นติ่งเนื้อชนิด adenoma 262 ติ่งเนื้อ คิดเป็นร้อยละ 52.3 และติ่งเนื้อชนิด hyperplastic 239 ติ่งเนื้อ คิดเป็นร้อยละ 47.7 มีติ่งเนื้อลำไส้ใหญ่ 3 ติ่งเนื้อที่ไม่ถูกตรวจพบโดยระบบ Deep-GI คิดเป็นร้อยละ 0.6 ในขณะที่มีติ่งเนื้อลำไส้ใหญ่ 73 ติ่งเนื้อที่ไม่ถูกตรวจพบโดยระบบ CAD EYE คิดเป็นร้อยละ 14.6 ซึ่งสูงกว่าอย่างมีนัยยะสำคัญทางสถิติ (p<0.01, ตามลำดับ) และยังพบว่า อัตราการพบผลบวกลวง (False positive alarm rate) น้อยกว่า 5 ครั้ง/การส่องกล้องลำไส้ใหญ่ในทั้ง 2 ระบบและ อัตราการพบผลบวกลวงในระบบ CAD EYE จะสูงกว่าระบบ Deep-GI อย่างมีนัยยะสำคัญทางสถิติเมื่อปรับเกณฑ์ชี้วัดสำหรับผลบวกลวงเป็น ≤ 1.5 วินาทีแต่อัตราการไม่พบ ติ่งเนื้อลำไส้ใหญ่จะเพิ่มสูงขึ้นเป็น 10-25% ถ้าปรับค่าเกณฑ์ชี้วัดสำหรับผลบวกลวงเป็น ≥1.5 วินาที สรุปผลการวิจัย: การศึกษานี้พบว่า เมื่อเปรียบเทียบประสิทธิภาพระหว่างระบบคอมพิวเตอร์ปัญญาประดิษฐ์2 ระบบ ในการการช่วยตรวจจับติ่งเนื้อลำไส้ ใหญ่ ระบบ Deep-GI มีอัตราการตรวจพบติ่งเนื้อลำไส้ใหญ่ (overall polyp detection rate) ที่สูงกว่า ในขณะที่ทำให้เกิดผลบวกลวงน้อยกว่า ที่เกณฑ์ชี้วัดสำหรับผลบวกลวง ≥0.5 วินาที และ ≥1 วินาทีอย่างมีนัยยะสำคัญทางสถิติค่าเกณฑ์ชี้วัดสำหรับผลบวกลวงที่ ≥1 วินาทีเป็นค่าเกณฑ์ชี้วัดที่เหมาะสมสำหรับระบบ Deep-GI และ CAD EYE เนื่องจากเป็นค่าที่ทำให้อัตราการไม่พบติ่งเนื้อลำไส้ใหญ่ (polyp miss rate) และเกิดผลบวกลวงต่ำที่สุด