Phân loại Clickbait cho tin tức tiếng Việt bằng phương pháp học máy

Nguyễn Huy Khoa

Please use this identifier to cite or link to this item: https://digital.lib.ueh.edu.vn/handle/UEH/69207

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Dr. Ngô Tấn Vũ Khanh	en_US
dc.contributor.author	Nguyễn Huy Khoa	en_US
dc.date.accessioned	2023-08-30T07:09:27Z	-
dc.date.available	2023-08-30T07:09:27Z	-
dc.date.issued	2023	-
dc.identifier.other	Barcode: 1000015890	-
dc.identifier.uri	https://opac.ueh.edu.vn/record=b1035386~S1	-
dc.identifier.uri	https://digital.lib.ueh.edu.vn/handle/UEH/69207	-
dc.description.abstract	Trong bài luận văn này, học viên đã trình bày tổng quan về các vấn đề liên quan đến khái niệm, phân loại, tính chất và cách xác định clickbait trong tiêu đề bài báo. Để giải quyết vấn đề này, đã sử dụng phương pháp học máy với 6 thuật toán khác nhau: Logistic Regression (LR), Decision Tree (TREE), Support Vector Machine (SVM), XGBoost (XGB), Random Forest (RF) và Gradient Boosting (GB). Kết quả cho thấy thuật toán Random Forest cho hiệu suất phân loại cao nhất, với giá trị F1-Score trung bình là 0.83. Trong khi đó, thuật toán SVM cho thấy hiệu suất phân loại thấp nhất, với giá trị F1-Score là 0.67. Hướng phát triển trong tương lai là tiếp tục nghiên cứu và phát triển các phương pháp học máy mới, cũng như cải tiến các thuật toán hiện có để nâng cao độ chính xác và hiệu quả trong việc phân loại clickbait. Tóm lại, việc sử dụng phương pháp học máy để phân loại clickbait trong tiêu đề bài báo đã mang lại những kết quả tích cực. Tuy nhiên, cần tiếp tục nghiên cứu và phát triển để cải thiện hiệu quả và đáng tin cậy của phương pháp này. Điều này sẽ giúp loại bỏ những tin tức giật gân không chính xác và mang lại giá trị cao hơn cho người đọc khi tìm kiếm thông tin trên các trang tin tức.	en_US
dc.format.medium	65 tr.	en_US
dc.language.iso	Vietnamese	en_US
dc.publisher	Trường Đại học Kinh tế Tp. Hồ Chí Minh	-
dc.subject	Học máy	en_US
dc.subject	Clickbait	en_US
dc.subject	Decision tree	en_US
dc.subject	Random forest	en_US
dc.subject	XGBoost	en_US
dc.subject	Gradient boosting	en_US
dc.subject	Logistic regression	en_US
dc.subject	Support Vector machine	en_US
dc.subject	Machine learning	en_US
dc.title	Phân loại Clickbait cho tin tức tiếng Việt bằng phương pháp học máy	en_US
dc.type	Master's Theses	en_US
ueh.speciality	Information Design and Technology (by Coursework) = Công nghệ thiết kế thông tin và truyền thông (hướng ứng dụng)	en_US
item.fulltext	Full texts	-
item.languageiso639-1	Vietnamese	-
item.openairetype	Master's Theses	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
item.grantfulltext	reserved	-
item.cerifentitytype	Publications	-
Appears in Collections:	MASTER'S THESES

Files in This Item:

File

Nguyễn Huy Khoa.pdf

Description

Size

1.31 MB

Format

Adobe PDF

Show simple item record

Google Scholar^TM

Check

Files in This Item:

Google ScholarTM

Google Scholar^TM