Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/55602
Title: ภาษาจำเพาะโดเมนสำหรับเขียนบทคำสั่งกระบวนการอีทีแอล
Other Titles: A DOMAIN SPECIFIC LANGUAGE FOR SCRIPTING ETL PROCESS
Authors: สุนิสา จันทร์สว่าง
Advisors: ญาใจ ลิ่มปิยะกรณ์
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Yachai.L@Chula.ac.th,limpyac@gmail.com
Issue Date: 2559
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: อีทีแอล (ย่อมาจาก ดึง-เปลี่ยนรูป-บรรจุข้อมูล) เป็นกระบวนการก่อนหน้าทั่วไปสำหรับการเตรียมข้อมูลแหล่งข้อมูลวิวิธภัณฑ์ ได้แก่ คลังข้อมูล การสร้างกระบวนการอีทีแอลมีความซับซ้อนและสิ้นเปลืองทรัพยากร อย่างไรก็ตาม กระบวนการดังกล่าวมีความสำคัญเนื่องจากเป็นชั้นบูรณาการในภาวะแวดล้อมของคลังข้อมูล และมีผลต่อความถูกต้องแม่นยำของข้อมูลในคลัง กระบวนการอีทีแอลสามารถแบ่งออกเป็น 2 ประเภทหลัก: อิงแบบจำลอง และอิงโค้ด อีทีแอลอิงแบบจำลองมีความเป็นมิตรกับผู้ใช้ ทว่าขยายความสามารถใช้กับระบบใหญ่ซับซ้อนได้ยาก ในขณะที่อีทีแอลอิงโค้ดต้องการทักษะด้านโปรแกรมมิง งานวิจัยนี้นำเสนอแนวทางอีทีแอลอิงโค้ดซึ่งคำสั่งการประมวลผลเขียนด้วยภาษาจำเพาะโดเมน ไม่ใช่ภาษาการโปรแกรมหรือภาษาค้นถาม โดยมีวัตถุประสงค์เพื่อปรับปรุงผลิตภาพและการใช้งานง่ายของกระบวนการอีทีแอล อินพุตสคริปต์อีทีแอลนอกจากจะเขียนด้วยภาษาจำเพาะโดเมนที่พัฒนาขึ้นในงานวิจัยแล้ว ยังสามารถเขียนอยู่ในรูปแบบเอกเซลเดิมที่เขียนโดยผู้ใช้ที่ไม่ใช่ทางด้านเทคนิค กระบวนทัศน์การแปลงแบบโค้ดทูโค้ดได้ถูกประยุกต์ใช้สำหรับการแปลงข้อความภาษาจำเพาะโดเมนเป็นจาวาโค้ด ตัวสร้างโค้ดอีทีแอลดีเอสแอลถูกพัฒนาด้วยสถาปัตยกรรมการออกแบบเอ็มวีซี กรณีศึกษาของแนวทางที่นำเสนอและการประเมินผลโดยผู้ใช้ได้ถูกอภิปราย ผลการให้คะแนนในภาพรวมคือ ผู้ใช้มีความพึงพอใจ
Other Abstract: ETL (Extract-Transform-Load) is considered as general preprocessing for data preparation of heterogeneous sources such as data warehouse. Building the ETL process is complex and resource consuming. However, it is crucial as the integration layer in data warehouse environment and contributes to the accuracy and the correctness of data in a warehouse. ETL processes can be mainly categorized into 2 types: model-based and code-based. The model-based ETL is user-friendly but hardly scales up with large complex systems, whereas the code-based ETL requires programming skill. This research presents an approach of code-based ETL of which the commands are written in a domain specific language, rather than programming or query languages. The objective is to improve the productivity and usability of the ETL process. In addition to directly write the ETL script with the domain-specific language developed in this work, the input of ETL scripts written by non-technical users in Excel format is also allowed. The paradigm of code-to-code transformation is applied for transforming the textual, domain-specific language into Java code. The etlDSL code generator is implemented with MVC architecture design. A case study and the user evaluation of the proposed approach are also discussed. The overall rating is satisfaction.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2559
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/55602
URI: http://doi.org/10.58837/CHULA.THE.2016.814
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2016.814
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
5870974921.pdf4 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.