Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/10266
Title: การศึกษาเปรียบเทียบการใช้ขั้นตอนวิธีการบีบอัดข้อมูลกับข้อมูลบนอินเทอร์เน็ตเพื่อปรับปรุงประสิทธิภาพของเว็บแคช
Other Titles: Comparative study of compression algorithms for data contents on the Internet for improving web caching performance
Authors: กัลย์ แก้วแก่น
Advisors: ณัฐวุฒิ หนูไพโรจน์
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Natawut.N@Chula.ac.th, natawut@cp.eng.chula.ac.th
Subjects: การบีบอัดข้อมูล
เว็บแคช
เว็บเซิร์ฟเวอร์
เวิลด์ไวด์เว็บ
Issue Date: 2543
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: ในช่วงระยะหลายปีที่ผ่านมา การใช้เว็บมีอัตราการเพิ่มขึ้นอย่างรวดเร็วและต่อเนื่อง ก่อให้เกิดความคับคั่งบนระบบเครือข่าย ทำให้ผู้ให้บริการอินเทอร์เน็ตต้องเพิ่มแบนด์วิดท์ในการเชื่อมต่อสู่อินเทอร์เน็ต งานวิจัยด้านเว็บแคชที่ผ่านมายังไม่มีการศึกษาเรื่องการใช้ขั้นตอนวิธีในการบีบอัดข้อมูลมาใช้ในแคช ดังนั้นงานวิจัยนี้จึงได้ทำการศึกษาถึงการใช้ขั้นตอนวิธีการบีบอัดข้อมูลแบบต่างๆ มาใช้กับข้อมูลที่ปรากฏอยู่ในเว็บแคช โดยใช้ข้อมูลการใช้เว็บของจุฬาลงกรณ์มหาวิทยาลัยเป็นกรณีศึกษา การวิเคราะห์หาประเภทข้อมูลที่มีการเรียกขอมาก พบว่า รูปภาพจิฟ เอกสารเอชทีเอ็มแอล และรูปภาพเจเพก มีการเรียกขอมากที่สุดเรียงตามลำดับ ข้อมูลที่สามารถทำการบีดอัดได้ที่นำมาทำการศึกษา คือ ข้อมูลตัวอักษร และรูปภาพเจเพก เมื่อแบ่งข้อมูลออกเป็นกลุ่มเท่าๆ กัน 8 กลุ่ม วัดค่าเวลาเฉลี่ยในการเรียกขอข้อมูล พบว่าเวลาที่ใช้เมื่อเกิดแคชมิสมากกว่าเวลาที่ใช้เมื่อเกิดแคชฮิท 5 วินาทีสำหรับข้อมูลประเภทตัวอักษร และ 8 วินาทีสำหรับข้อมูลรูปภาพเจเพก เมื่อทำการซ่อมข้อมูลแบบไม่ซ้ำจากอินเทอร์เน็ตมาทดลองกับขั้นตอนวิธีการบีบอัดข้อมูลแบบต่างๆ วัดค่าอัตราการบีบอัด เวลาที่ใช้ในการบีดอัดและเวลาที่ใช้ในการขยายข้อมูล และทำการเปรียบเทียบการตัดสินใจเลือกขั้นตอนวิธีการบีดอัด ใช้อัตราการบีบอัดเป็นเครื่องมือในการตัดสินใจ เนื่องจากเวลาที่ใช้ในการบีบอัดและเวลาในการขายข้อมูล มีค่าน้อยกว่าค่าส่วนต่างของเวลาที่ได้จากการวิเคราะห์เวลาเฉลี่ยที่ใช้ในการเรียกขอข้อมูล ผลการวิจัยสรุปว่า ข้อมูลประภทตัวอักษรขนาดเล็กควรใช้ LZA ขนาดใหญ่ควรใช้ ZIP ข้อมูลรุปภาพเจเพกขนาดเล็กควรใช้ LZA ขนาดกลางควรใช้ ZIP ขนาดใหญ่ควรใช้ LZA
Other Abstract: During the past few years, Web usage has rapidly increased. This causes the bottleneck on network and ISPs have to extend the bandwidth through the Internet. There has been no research on the compression algorithm for web caching. In this thesis we study the compression algorithm for web contents based on web usage data of Chulalongkorn University. Our study indicated that GIF, HTML and JPEG are the most requested content type. In our study, we examine the compression algorithm for TEXT and JPEX formats. Dividing data into 8 equal groups, we measured the average request time and found that cache miss time is 5 seconds and 8 seconds greater than cache hit time for TEXT and JPEG respectively. We randomly retrieved data from the Internet and measured the performance of data compression algorithms regrarding compression ratio, compression time, and decompression time. We use compression ratio as a metric for comparing the compression algorithms because both compression time and decompression time are less than the average request time from the analysis above. Our study concludes that the LZA is suitable for small-sized TEXT and the ZIP is suitable for large-size TEXT. For small-, medium-, and large-sized JPEG, we recommend LzA, ZIP, and LZA respectively.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2543
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/10266
ISBN: 9741309457
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
KunKaewKen.pdf816.85 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.