Abstract:
งานวิจัยฉบับนี้มีวัตถุประสงค์ เพื่อศึกษาและเปรียบเทียบวิธีการวิเคราะห์ความสำคัญของกลุ่มยีน และการถดถอยโลจิสติกทวิภาค ในการหาค่า p-value ของแต่ละเซตยีน โดยคำนึงถึงความสัมพันธ์และการทำงานร่วมกันเป็นเซตของยีนเป็นหลัก โดยการศึกษานี้จะเปรียบเทียบประสิทธิภาพ จากการวิเคราะห์ข้อมูลจำลองทั้งในกรณีที่ข้อมูลมีขนาดตัวอย่างมากกว่าจำนวนของยีนหรือตัวแปรอิสระ และกรณีที่ข้อมูลมีขนาดตัวอย่างน้อยกว่าจำนวนของตัวแปรอิสระ หรือที่เรียกว่า “ข้อมูลที่มีมิติสูง” ในขอบเขตการศึกษาต่างๆกัน ในงานวิจัยนี้จะเปรียบเทียบค่าอัตราความผิดพลาดรวม และค่าอำนาจในการทดสอบเพื่อวัดประสิทธิภาพจากวิธีทั้งสอง จากการศึกษาภายใต้ขอบเขตดังกล่าวผลปรากฏว่าวิธีการถดถอยโลจิสติกทวิภาค มีค่าอำนาจการทดสอบ(เฉลี่ย)สูง ในกรณีขนาดตัวอย่างมากกว่าจำนวนของตัวแปรอิสระ ในขณะที่วิธีการวิเคราะห์ความสำคัญของกลุ่มยีนมีค่าอำนาจการทดสอบ(เฉลี่ย)สูง ในกรณีขนาดตัวอย่างน้อยกว่าจำนวนของตัวแปรอิสระ แต่เมื่อพิจารณาถึงการวัดประสิทธิภาพจากค่าอัตราความผิดพลาดรวม พบว่าวิธีการวิเคราะห์ความสำคัญของกลุ่มยีนมีค่าต่ำ สำหรับกรณีขนาดตัวอย่างมากกว่าจำนวนของตัวแปรอิสระ ในขณะที่วิธีการถดถอยโลจิสติกทวิภาค มีค่าต่ำสำหรับกรณีขนาดตัวอย่างน้อยกว่าจำนวนของตัวแปรอิสระ