Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/12961
Title: การจัดประเภทของเว็บโดยการเชื่อมโยงของเว็บในระดับเพจและบล็อก
Other Titles: Web classification by connectivity at page and block level
Authors: พรทิพย์ มาลีลัย
Advisors: นครทิพย์ พร้อมพูล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Nakornthip.S@Chula.ac.th
Subjects: เว็บไซต์
บล็อก
ดาต้าไมนิง
ต้นไม้ตัดสินใจ
การเรียนรู้ของเครื่อง
Issue Date: 2549
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: จัดประเภทของเว็บไซต์โดยการเชื่อมโยงของเว็บในระดับเพจและบล็อกให้เป็นหมวดหมู่ เพื่อช่วยด้านการสืบค้นข้อมูล โดยการนำเสนอการประยุกต์ใช้คุณลักษณะระดับเพจและบล็อก มาช่วยในการจัดประเภทของเว็บไซต์ ผู้วิจัยได้ใช้ประเภทของเว็บไซต์จำนวน 11 ประเภท จำนวน 265 เว็บไซต์ รวมทั้งสิ้น 2,650 เพจ โดยใช้อัลกอริทึม VIPS ในการแบ่งเพจเป็นพล็อก แล้วคำนวณค่าคุณลักษณะระดับเพจและบล็อก จากนั้นได้ใช้วิธีการเรียนรู้ของเครื่องแบบ See5 แสดงให้เห็นค่าความถูกต้องในการจัดประเภทของเว็บไซต์ ผลการทดลองที่ได้จากการวิจัยในครั้งนี้ แสดงค่าความผิดพลาดที่เกิดจากการจัดประเภทของเว็บไซต์ที่พิจารณาจากคุณลักษณะระดับเพจ คุณลักษณะระดับบล็อก คุณลักษณะระดับเพจและบล็อก ซึ่งให้ค่าผิดพลาดที่เรียงจากน้อยที่สุดไปหามากที่สุดคือ การจัดประเภทของเว็บไซต์โดยใช้คุณลักษณะระดับเพจเป็น 62.5% การจัดประเภทของเว็บไซต์โดยใช้คุณลักษณะระดับเพจและระดับบล็อกเป็น 67.8% และการจัดประเภทของเว็บไซต์โดยใช้คุณลักษณะระดับบล็อกเป็น 75.9% ทั้งนี้แนวทางของการทดลองในงานวิจัยนี้ อาจสามารถนำไปปรับปรุงให้ดีขึ้นโดยการให้ความสำคัญในการเลือกหน่วยตัวอย่าง และเพิ่มจำนวนเพจที่อยู่ในเว็บไซต์เพื่อนำมาซึ่งผลการทดลองที่ดีขึ้นต่อไป
Other Abstract: To classify web sites by connectivity at page and block level which helps information searching. This research appiles features at page and block level for web classification. In carrying out this research, researcher uses 11 types of web sites, 265 web site and 2,650 pages. VIPS algorithm is also used to devide page to block. Then page features an block features are computed. After that, See5 is used to caassify and evaluate the accuracy of web site classification. The result of this experiment has shown error of web site classification which considers by features in page level, block level and page&block levle. The values of percentage error for using only page features, page and block features and only block features are 62.6%, 67.8% and 75.9% respectively. The experiment from this research can be improved by emphasizing on the selection of the sample units of web site and throughly considering to increase more pages in each web site to give more classification accuracy.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2549
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/12961
URI: http://doi.org/10.14457/CU.the.2006.1102
metadata.dc.identifier.DOI: 10.14457/CU.the.2006.1102
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Porntip_ma.pdf1.7 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.