Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/79049
Title: Hybrid (Content-based filtering and Collaborative filtering) recommender system based on BERT
Other Titles: ระบบแนะนำผู้ใช้แบบผสม (การกรองเนื้อหาและการกรองแบบร่วมมือกัน) โดยมีพื้นฐานอยู่บน BERT
Authors: Chanapa Channarong
Chawisa Paosirikul
Advisors: Saranya Maneeroj
Kitiporn Plaimas
Other author: Chulalongkorn University. Faculty of Science
Subjects: Recommender systems (Information filtering)
Neural networks (Computer science)
ระบบแนะนำข้อมูล (การกรองสารสนเทศ)
นิวรัลเน็ตเวิร์ค (วิทยาการคอมพิวเตอร์)
Issue Date: 2019
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: Recommender system (RS) is the system that recommends items to users based on user preference. There are two main methods that are used in RS, including content-based filtering (CBF) and collaborative filtering (CF). However, these two main methods are not effective enough to get the better recommendation. Hence, many people have explored other methods such as neural content-based filtering and neural collaborative filtering. But those methods do not focus on the interaction sequence of the target user. Recently, there are researches that proposed to model sequential recommendations based on users’ historical interaction. One of these is BERT4Rec which takes BERT, a language understanding model, to model a sequential recommendation. This method only considers the historical sequence (item sequence) of the target user and does not consider the interaction of other users in the system that is content-based filtering approach. For this reason, we proposed a new method called Hybrid recommender system based on BERT, which applied BERT on both CBF and CF. For CBF, we consider the item sequence of the target user as same as BERT4Rec, but the result of our proposed method is the target user profile. For CF, we consider other users who used to interact with the target item and call it as user sequence of the target item. The result of the CF side is the target item profile. Finally, after obtaining the results on both CBF and CF side, we use it to predict the rating score by the NCF approach. To evaluate our proposed method, we compared it with BERT4Rec on MovieLens-1M dataset in terms of accuracy by the NDCG approach. The experimental result shows that our proposed method outperforms BERT4Rec.
Other Abstract: ระบบแนะนำเป็นระบบที่แนะนำไอเท็มให้กับผู้ใช้โดยพิจารณาจากความชื่นชอบของผู้ใช้เป็นหลักซึ่งวิธีพื้นฐานที่ใช้ในระบบแนะนำมีอยู่สองวิธีได้แก่ การกรองเนื้อหาและการกรองแบบร่วมมือกัน แต่วิธีพื้นฐานดังกล่าวยังมีประสิทธิภาพในการแนะนำไม่เพียงพอ ดังนั้นจึงมีผู้คิดค้นวิธีอื่น ๆ เช่น โครงข่ายประสาทเทียมแบบการกรองเนื้อหา และโครงข่ายประสาทเทียมแบบการกรองแบบร่วมมือกัน แต่อย่างไรก็ตามวิธีเหล่านี้ต่างก็ไม่ได้ให้ความสำคัญกับลำดับของการปฏิสัมพันธ์ของผู้ใช้เป้าหมาย ด้วยเหตุนี้ในปัจจุบันจึงมีการทำระบบแนะนำแบบลำดับเพิ่มมากขึ้น หนึ่งในนั้นก็คือ BERT4Rec ที่นำ BERT ที่เป็นโมเดลด้านความเข้าใจในภาษาเข้ามาทำระบบแนะนำแบบลำดับ ซึ่งในงานนี้สนใจแต่ประวัติที่เป็นลำดับของไอเท็มของผู้ใช้เป้าหมาย และไม่ได้สนใจข้อมูลของผู้ใช้คนอื่น ๆ ในระบบเลย กล่าวคือมีเพียงวิธีการของการกรองเนื้อหา ดังนั้นผู้วิจัยจึงเสนอวิธีการใหม่ที่เรียกว่า ระบบแนะนำผู้ใช้แบบผสมโดยมีพื้นฐานอยู่บน BERT ซึ่งเป็นการนำ BERT เข้ามาทำทั้งในส่วนการกรองเนื้อหาและการกรองแบบร่วมมือกัน โดยในส่วนของการกรองเนื้อหาจะพิจารณาประวัติที่เป็นลำดับของไอเท็มของผู้ใช้เป้าหมายเช่นเดียวกันกับโมเดล BERT4Rec แต่จะให้ผลลัพธ์เป็นโปรไฟล์ของผู้ใช้เป้าหมาย และในส่วนของการกรองแบบร่วมมือกันจะนำผู้ใช้คนอื่นที่เคยให้คะแนนไอเท็มเป้าหมายมาทำเป็นลำดับและให้ผลลัพธ์เป็นโปรไฟล์ของไอเท็มเป้าหมาย จากนั้นนำผลลัพธ์ของการกรองเนื้อหาและการกรองแบบร่วมมือกันมาคำนวณคะแนนโดยใช้วิธีการของ NCF ผู้วิจัยได้ใช้ข้อมูลของ MovieLens-1M เพื่อเปรียบเทียบประสิทธิภาพของวิธีการที่ได้นำเสนอกับโมเดล BERT4Rec โดยจะเปรียบเทียบในด้านของความถูกต้องโดยใช้วิธีการของ NDCG ซึ่งจากผลการทดลองพบว่าวิธีการที่ผู้วิจัยเสนอให้ผลลัพธ์ที่ดีกว่าโมเดล BERT4Rec
Description: โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2562
URI: http://cuir.car.chula.ac.th/handle/123456789/79049
Type: Senior Project
Appears in Collections:Sci - Senior Projects

Files in This Item:
File Description SizeFormat 
62-SP-MATH-057 - Chanapa Channarong.pdf1.17 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.