Abstract:
งานวิจัยฉบับนี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการคัดกรองตัวแปรอิสระจากวิธี Lasso, Adaptive Lasso และ Elastic Net สำหรับการทดสอบกลุ่มของสัมประสิทธิ์การถดถอยที่มีมิติสูง โดยใช้เทคนิคการจัดกลุ่มแบบเป็นลำดับชั้น ในการจัดกลุ่มตัวแปรตามความสัมพันธ์ของตัวแปรอิสระ จากนั้นจึงใช้วิธีการแบ่งข้อมูลแบบสุ่มหลายๆครั้ง เพื่อหาค่า p-value ของกลุ่มสัมประสิทธิ์การถดถอยแต่ละกลุ่ม โดยการศึกษานี้จะเปรียบเทียบประสิทธิภาพของวิธีคัดกรองตัวแปรอิสระจากการจำลองข้อมูลและใช้ข้อมูลจริงที่มีขอบเขตต่างๆกัน โดยในส่วนของข้อมูลจำลองมีอัตราส่วนของขนาดตัวอย่างต่อจำนวนตัวแปรเท่ากับ 100: 500 และ 100:1000 และความสัมพันธ์ของตัวแปรอิสระเป็น 0.0 , 0.5 และ 0.9 ขณะที่ในส่วนของข้อมูลจริงจะมีความสัมพันธ์ของตัวแปรแปรอิสระเป็น 2 แบบคือมีความสัมพันธ์แบบปกติและมีความสัมพันธ์กันสูง ทั้งนี้จะใช้อัตราความผิดพลาดรวม และอำนาจการทดสอบเป็นเครื่องมือในการเปรียบเทียบและการวัดประสิทธิภาพ การศึกษาภายใต้ขอบเขตดังกล่าวผลปรากฏว่าการคัดกรองตัวแปรทั้ง 3 วิธีให้อำนาจการทดสอบต่ำ ซึ่งเมื่อเปรียบเทียบการคัดกรอง 3 วิธีพบว่า วิธี Lasso มีอำนาจการทดสอบมากที่สุด รองลงมาคือวิธี Adaptive Lasso และ วิธี Elastic Net ตามลำดับ แต่เมื่อพิจารณาถึงอัตราความผิดพลาดรวม พบว่าวิธี Adaptive Lasso และวิธี Elastic Net มีค่าต่ำที่สุด