Title: | Phân loại Clickbait cho tin tức tiếng Việt bằng phương pháp học máy |
Author(s): | Nguyễn Huy Khoa |
Advisor(s): | Dr. Ngô Tấn Vũ Khanh |
Keywords: | Học máy; Clickbait; Decision tree; Random forest; XGBoost; Gradient boosting; Logistic regression; Support Vector machine; Machine learning |
Abstract: | Trong bài luận văn này, học viên đã trình bày tổng quan về các vấn đề liên quan đến khái niệm, phân loại, tính chất và cách xác định clickbait trong tiêu đề bài báo. Để giải quyết vấn đề này, đã sử dụng phương pháp học máy với 6 thuật toán khác nhau: Logistic Regression (LR), Decision Tree (TREE), Support Vector Machine (SVM), XGBoost (XGB), Random Forest (RF) và Gradient Boosting (GB). Kết quả cho thấy thuật toán Random Forest cho hiệu suất phân loại cao nhất, với giá trị F1-Score trung bình là 0.83. Trong khi đó, thuật toán SVM cho thấy hiệu suất phân loại thấp nhất, với giá trị F1-Score là 0.67. Hướng phát triển trong tương lai là tiếp tục nghiên cứu và phát triển các phương pháp học máy mới, cũng như cải tiến các thuật toán hiện có để nâng cao độ chính xác và hiệu quả trong việc phân loại clickbait. Tóm lại, việc sử dụng phương pháp học máy để phân loại clickbait trong tiêu đề bài báo đã mang lại những kết quả tích cực. Tuy nhiên, cần tiếp tục nghiên cứu và phát triển để cải thiện hiệu quả và đáng tin cậy của phương pháp này. Điều này sẽ giúp loại bỏ những tin tức giật gân không chính xác và mang lại giá trị cao hơn cho người đọc khi tìm kiếm thông tin trên các trang tin tức. |
Issue Date: | 2023 |
Publisher: | Trường Đại học Kinh tế Tp. Hồ Chí Minh |
URI: | https://opac.ueh.edu.vn/record=b1035386~S1 https://digital.lib.ueh.edu.vn/handle/UEH/69207 |
Appears in Collections: | MASTER'S THESES
|