Phân loại Clickbait cho tin tức tiếng Việt bằng phương pháp học máy

Nguyễn Huy Khoa

Please use this identifier to cite or link to this item: https://digital.lib.ueh.edu.vn/handle/UEH/69207

Title:	Phân loại Clickbait cho tin tức tiếng Việt bằng phương pháp học máy
Author(s):	Nguyễn Huy Khoa
Advisor(s):	Dr. Ngô Tấn Vũ Khanh
Keywords:	Học máy; Clickbait; Decision tree; Random forest; XGBoost; Gradient boosting; Logistic regression; Support Vector machine; Machine learning
Abstract:	Trong bài luận văn này, học viên đã trình bày tổng quan về các vấn đề liên quan đến khái niệm, phân loại, tính chất và cách xác định clickbait trong tiêu đề bài báo. Để giải quyết vấn đề này, đã sử dụng phương pháp học máy với 6 thuật toán khác nhau: Logistic Regression (LR), Decision Tree (TREE), Support Vector Machine (SVM), XGBoost (XGB), Random Forest (RF) và Gradient Boosting (GB). Kết quả cho thấy thuật toán Random Forest cho hiệu suất phân loại cao nhất, với giá trị F1-Score trung bình là 0.83. Trong khi đó, thuật toán SVM cho thấy hiệu suất phân loại thấp nhất, với giá trị F1-Score là 0.67. Hướng phát triển trong tương lai là tiếp tục nghiên cứu và phát triển các phương pháp học máy mới, cũng như cải tiến các thuật toán hiện có để nâng cao độ chính xác và hiệu quả trong việc phân loại clickbait. Tóm lại, việc sử dụng phương pháp học máy để phân loại clickbait trong tiêu đề bài báo đã mang lại những kết quả tích cực. Tuy nhiên, cần tiếp tục nghiên cứu và phát triển để cải thiện hiệu quả và đáng tin cậy của phương pháp này. Điều này sẽ giúp loại bỏ những tin tức giật gân không chính xác và mang lại giá trị cao hơn cho người đọc khi tìm kiếm thông tin trên các trang tin tức.
Issue Date:	2023
Publisher:	Trường Đại học Kinh tế Tp. Hồ Chí Minh
URI:	https://opac.ueh.edu.vn/record=b1035386~S1 https://digital.lib.ueh.edu.vn/handle/UEH/69207
Appears in Collections:	MASTER'S THESES

Files in This Item:

File

Nguyễn Huy Khoa.pdf

Description

Size

1.31 MB

Format

Adobe PDF

Show full item record

Google Scholar^TM

Check

Files in This Item:

Google ScholarTM

Google Scholar^TM