Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/55349
Title: การจัดสรรชิ้นส่วนข้อมูลบันทึกสารสนเทศในมองโกดีบี
Other Titles: Sharding Allocation of IT Log Data in MongoDB
Authors: บุญญฤทธิ์ อุณหะวัฒน์
Advisors: ณัฐวุฒิ หนูไพโรจน์
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Natawut.N@Chula.ac.th,natawut.n@chula.ac.th
Issue Date: 2559
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: ข้อมูลบันทึกสารสนเทศมีลักษณะที่ส่งผลกระทบต่อประสิทธิภาพการทำงานหากได้รับการพัฒนาที่ไม่เหมาะสมกับลักษณะข้อมูล จากการศึกษาพบว่าลักษณะแนวทางการกระจายตัวของชิ้นส่วนข้อมูลส่งผลถึงประสิทธิภาพการทำงานโดยรวมของระบบทั้งจากการจัดเก็บข้อมูลและการสืบค้น ซึ่งวิธีการกระจายข้อมูลที่มีมาแต่เดิมในระบบอันได้แก่การกระจายแบบพิสัยและแฮช(hash)นั้นมีข้อดีข้อเสียแตกต่างกันอย่างชัดเจน โดยเฉพาะเมื่อระบบอยู่ในสภาวะที่ต้องรองรับงานเกินขีดจำกัด เป้าหมายงานวิจัยนี้จะศึกษาถึงแนวทางการกระจายของข้อมูลและจัดสรรชิ้นส่วนข้อมูลให้อยู่ในลักษณะที่สามารถนำเอาทรัพยากรของระบบมาใช้ได้อย่างเต็มประสิทธิภาพและลดผลกระทบของภาระการทำงานของเครื่องในระบบ นี้ได้นำความสามารถของระบบการติดป้ายข้อมูลมาประยุกต์ใช้กับแผนการกระจายข้อมูลพื้นฐาน โดยในการทดลองเราได้จำลองระบบฐานข้อมูลแบบกระจายด้วย มองโกดีบี ขึ้นมาเพื่อใช้ในการวิจัยเปรียบเทียบประสิทธิภาพการทำงานโดยข้อมูลบันทึกสารสนเทศที่ถูกจำลองขึ้นมาใช้ในงานวิจัยนี้ได้ทำการอ้างอิงโครงสร้างข้อมูลจากระบบไอทีของมหาวิทยาลัยจุฬาลงกรณ์ และการทดลองจะวัดประสิทธิภาพจากการทำงานหลักๆสองประเภทได้แก่ การจัดเก็บข้อมูล และ การสืบค้นข้อมูล ภายใต้เงื่อนไขที่สภาพการทำงานของระบบอยุ่ในสภาวะปกติและทำงานหนัก ซึ่งประสิทธิภาพการทำงานจะถูกประเมิณจากปริมาณงานที่ทำเสร็จและเวลาที่ใช้ในการประมวลผล งานวิจัยนี้ได้นำเสนอกระบวนการกระจายข้อมูลแบบใหม่ที่เหมาะสมกับข้อมูลบันทึกสารสนเทศ โดยการประยุกต์การกระจายข้อมูลแบบติดป้ายข้อมูล ร่วมกับการคาดการณ์ความเร็วของข้อมูลขาเข้า ซึ่งทำให้ระบบสามารถจัดเก็บข้อมูลข้อมูลได้เร็วกว่าวิธีแบบพิสัยและแบบแฮช ในขณะที่ยังสามารถคงไว้ซึ่งประสิทธิภาพที่ดีในส่วนการสืบค้นข้อมูลไม่ว่าจะเป็นในภาวะที่ไม่มีการบันทึกข้อมูล จนถึงในภาวะที่มีการบันทึกข้อมูลจำนวนมาก
Other Abstract: Log Data characteristics are fast growing and have large amount of data which end up affect system performance. Due to this reason, there are high demand of the distributed system that can answer the performance problems. According to the studied, data distribution strategy greatly affects overall system performance including both insert and query operation. Range and Hash data distribution strategy have different kind of advantage and disadvantage that will affect entire system especially during the time when system suffer from hotspot. The goal of this research is to study the data distribution strategy and data allocation and how to archive highest efficiency from using system resource and reduce the affect from performance problems. In this research, we take advantage of the tag aware function by incorporate function with range data distribution strategy. For the experiment, we simulate distribution database system using MongoDB for the purpose of compare the performance between each data distribution strategy. log data use in this experiment are based on the log data from Chulalongkorn University IT log system. There’re two main experiment which are insert data and data query based experiment. The performance evaluation will be measure by the insert throughput and the completion time. This research proposed a new data distribution strategy suitable for storing log data. Using tag distribution and incoming data velocity forecasting, our proposed strategy performed much faster than Range and Hash distribution for inserting operations. The strategy also performed very well for query operations during both light-load and heavy-load data insertion.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2559
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/55349
URI: http://doi.org/10.58837/CHULA.THE.2016.813
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2016.813
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
5670264821.pdf2 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.