Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/28781
Title: การเปรียบเทียบอำนาจการทดสอบของตัวสถิติทดสอบการเท่ากันของค่าเฉลี่ยของประชากร 2 ชุด ที่มีการแจกแจงชนิดลอง-เทลด์
Other Titles: A comparison of the power of the test among test statistics for testing equality of two population means under long-tailed distribution
Authors: เลิศสรรพ์ เมฆสุต
Advisors: สรชัย พิศาลบุตร
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Issue Date: 2530
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยนี้มีวัตถุประสงค์เพื่อศึกษาเปรียบเทียบตัวสถิติทดสอบประเภทต่างๆ ที่ใช้ในการทดสอบสมมติฐานการเท่ากันของค่าเฉลี่ยของประชากร 2 ชุดได้แก่ ตัวสถิติทดสอบทริมด์ ที่ตัวสถิติทดสอบแมน-วิทนีย์ และตัวสถิติทดสอบแวน เดอ แวร์เดน สำหรับตัวสถิติทดสอบบทริมด์ ที่นักศึกษาเปรียบเทียบวิธีการเลือกระดับการทริมด์ 3 วิธีคือ วิธีค่าประมาณความแปรปรวนน้อยที่สุดวิธีคอมบายด์ คิว และวิธีเฉลี่ย คิว เพื่อให้ได้รับการเลือกระดับการทริมด์ ที่เหมาะสมที่สุดสำหรับตัวสถิติทดสอบทริมด์ ที และนำไปศึกษาเปรียบเทียบความสามารถในการควบคุมความคลาดเคลื่อนประเภทที่ 1 และอำนาจการทดสอบกับตัวสถิติทดสอบอีก 2 ประเภทดังกล่าว โดยศึกษาเปรียบเทียบตัวสถิติทดสอบประเภทต่างๆ เมื่อประชากรมีการแจกแจงชนิดลอง-เทลด์แบบต่างๆ ได้แก่การแจกแจงแบบโลจิสติค ดับเบิ้ลเอกซ์โปเนนเชียล และสเกลคอนทามิเนทด์นอร์มอลที่เปอร์เซ็นต์คอนทามิเนทด์ 10 20 สเกลแฟคเตอร์ 3 5 และ 7 ขนาดของตัวอย่างที่ใช้ในการศึกษาแบ่งเป็นกรณีที่ขนาดของตัวอย่างเท่ากัน คือ อัตราส่วนของขนาดตัวอย่างเป็น 1:1 และกรณีที่ขนาดของตัวอย่างไม่เท่ากัน ศึกษาเมื่ออัตราส่วนของขนาดตัวอย่างเป็น 1:2 และ 1:4 โดยที่ผลของขนาดตัวอย่างทั้ง 2 ชุดเท่ากับ 20 30 40 และ 60 สำหรับที่ใช้ในการทดลองนั้นจำลองด้วยโปรแกรมคอมพิวเตอร์ โดยใช้เทคนิคมอนติคาร์โลซึมูเลชั่น ซึ่งทำการทดลองซ้ำ 1,000 ครั้งในแต่ละสถานการณ์ของการทดลอง ผลจากการศึกษาความสามารถในการควบคุมความฉลาดเคลื่อนประเภทที่ 1 และอำนาจการทดสอบ สามารถสรุปได้ดังนี้คือ 1. วิธีค่าประมาณความแปรปรวนน้อยที่สุด เป็นวิธีการเลือกระดับการทริมด์ ที่มีความสามารถในการควบคุมความคลาดเคลื่อนประเภทที่ 1 ได้น้อยที่สุด ในขณะที่วิธีคอมบายด์ คิว สามารถควบคุมได้ดีที่สุด ดังนั้นการวิจัยนี้จึงใช้วิธีคอมบายด์ คิว สำหรับตัวสถิติทดสอบทริมด์ ที่ในการศึกษาเปรียบเทียบอำนาจการทดสอบ 2. ตัวสถิติทดสอบแมน-วิทนีย์ ยู และตัวสถิติทดสอบแวน เดอ แวร์เดน สามารถควบคุมความคลาดเคลื่อนประเภทที่ 1 ได้ดีและดีกว่าตัวสถิติทดสอบทริมด์ ที สำหรับทุกวิธีการเลือกระดับการทริมด์ 3. เมื่อประชากรมีการแจกแจงแบบโลจิสติค โดยทั่วไปตัวสถิติทดสอบทั้ง 3 ประเภทมีอำนาจการทดสอบใกล้เคียงกัน 4. เมื่อประชากรมีการแจกแจงแบบดับเบิ้ลเอกซ์โปเนนเชียล โดยทั่วไปตัวสถิติทดสอบทริมด์ ที และตัวสถิติทดสอบแมน-วิทนีย์ ยู มีอำนาจทดสอบสูงที่สุด ยกเว้นกรณีอัตราส่วนของขนาดตัวอย่างเป็น 1:4 ตัวสถิติทดสอบทริมด์ ที จะมีอำนาจการทดสอบสูงที่สุด 5. เมื่อประชากรมีการแจกแจงแบบสเกลคอนทามิเนทด์นอร์มอล ตัวสถิติทดสอบทั้ง 3 ประเภท มีอำนาจการทดสอบใกล้เคียงกัน ถ้าการแจกแจงของประชากรมีลักษณะเป็นลอง-เทลด์ไม่มากนัก คือ ที่เปอร์เซ็นต์คอนทามิเนทด์ 10 และสเกลแฟคเตอร์ 3 แต่เมื่อการแจกแจงของประชากรมีลักษณะเป็นลอง-เทลด์มากขึ้น เช่น ที่เปอร์เซ็นต์คอนทามิเนทด์ 20 สเกลแฟคเตอร์ 3 และเปอร์เซนต์คอนมิเนทด์ 10 สเกลแฟคเตอร์ 5 ตัวสถิติทดสอบทริมด์ ที และตัวสถิติทดสอบ แมน-วิทนีย์ ยู มีอำนาจการทดสอบสูงที่สุด ส่วนที่เปอร์เซ็นต์คอนทามิเนทด์ และสเกลแฟคเตอร์อื่นซึ่งเป็นการแจกแจงที่มีลักษณะเป็นลอง-เทลด์มาก ตัวสถิติทดสอบทริด์ ที จะมีอำนาจการทดสอบสูงที่สุด โดยเฉพาะเมื่อความแตกต่างระหว่างขนาดของตัวอย่าง 2 ชุดมากขึ้น ยกเว้นกรณีที่ขนาดของตัวอย่างเป็น (4, 16) ที่ระดับนัยสำคัญ .01 ตัวสถิติทดสอบแมน-วิทนีย์ ยู มีอำนาจการทดสอบสูงที่สุด ส่วนที่ระดับนับสำคัญ .05 และ .10 ตัวสถิติทดสอบแมน-วิทนีย์ ยู และตัวสถิติทอสอบแวน เดอ แวร์เดน จะมีอำนาจการทดสอบสูงที่สุด
Other Abstract: The purpose of this study is to compare test statistics for testing equality of two population means namely trimmed t test, Mann-whitney U test and Van der Waerden test. This study first compares and chooses methods of selecting level of trimming most suitable for trimmed t test; namely minimum estimate variance, combined Q and average Q. Then the comparisons of the capability of controlling probability of type I error and power of the test were made among the three test statistics. The comparisons were made for populations with different long-tailed distributions which are logistic distribution, double exponential distribution and scale contaminated normal distribution. Ten and twenty percent contamination were used with 3, 5 and 7 scale factors in the scale contaminated normal distribution. Three sample size ratios were used in the study an equal sample size ratio of 1:1 and two unequal sample size ratios of 1:2 and 1:4 while the Siam of the two sample sizes are 20, 30, 40 and 60 for each ratio. The data were obtained by simulation using Monte Carlo technique and computer program repeat the study 1,000 times for each circumstance. Results of the study in the comparison of the capability of controlling probability of type I error and power of the test can be summarized as followed: 1. The combined Q is the best method in controlling the probability of type I error while the minimum variance estimate is the worst method for trimmed t test. Therefore this study uses the combined Q method for trimmed t test in the comparison of the power of test. 2. Mann-whitney U test and Van der Waerden test are good in controlling the probability of type I error and better than trimmed t test for any method of selecting level of trimming. 3. The power of the three test statistics are similar under logistic distribution. 4. For double exponential distribution, trimmed t test and Mann-whitney test have higher power than Van der Waerden test. But in case of 1:4 sample size ratio, trimmed t test is the most powerful. 5. For scale contaminated normal distribution, the power of the three test statistics are similar under low degree of long-tailed distribution in which percent contamination is 10 and scale factor is 3. But for moderate long-tailed distribution in which percent contamination is 20, scale factor is 3 and when percent contamination is 10, scale factor is 5; trimmed t test and Mann-whitney U test have higher power than Van der Waerden. And for extreme long-tailed distribution, trimmed t test is the most powerful test statistics especially when the difference between the two sample sizes is large. The exception is for the sample sizes are 4 and 16, Mann-whitney U test is the most powerful test at .01 level of significance also Mann-whitney U test and van der Waerden test have higher power than trimmed t test at .05 and .10 level of significance.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2530
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/28781
ISBN: 9745680834
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Lertsun_me_front.pdf28.24 MBAdobe PDFView/Open
Lertsun_me_ch1.pdf9.53 MBAdobe PDFView/Open
Lertsun_me_ch2.pdf14.04 MBAdobe PDFView/Open
Lertsun_me_ch3.pdf6.24 MBAdobe PDFView/Open
Lertsun_me_ch4.pdf159.6 MBAdobe PDFView/Open
Lertsun_me_ch5.pdf7.14 MBAdobe PDFView/Open
Lertsun_me_back.pdf11.24 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.