Please use this identifier to cite or link to this item:
https://digital.lib.ueh.edu.vn/handle/UEH/69207
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Dr. Ngô Tấn Vũ Khanh | en_US |
dc.contributor.author | Nguyễn Huy Khoa | en_US |
dc.date.accessioned | 2023-08-30T07:09:27Z | - |
dc.date.available | 2023-08-30T07:09:27Z | - |
dc.date.issued | 2023 | - |
dc.identifier.other | Barcode: 1000015890 | - |
dc.identifier.uri | https://opac.ueh.edu.vn/record=b1035386~S1 | - |
dc.identifier.uri | https://digital.lib.ueh.edu.vn/handle/UEH/69207 | - |
dc.description.abstract | Trong bài luận văn này, học viên đã trình bày tổng quan về các vấn đề liên quan đến khái niệm, phân loại, tính chất và cách xác định clickbait trong tiêu đề bài báo. Để giải quyết vấn đề này, đã sử dụng phương pháp học máy với 6 thuật toán khác nhau: Logistic Regression (LR), Decision Tree (TREE), Support Vector Machine (SVM), XGBoost (XGB), Random Forest (RF) và Gradient Boosting (GB). Kết quả cho thấy thuật toán Random Forest cho hiệu suất phân loại cao nhất, với giá trị F1-Score trung bình là 0.83. Trong khi đó, thuật toán SVM cho thấy hiệu suất phân loại thấp nhất, với giá trị F1-Score là 0.67. Hướng phát triển trong tương lai là tiếp tục nghiên cứu và phát triển các phương pháp học máy mới, cũng như cải tiến các thuật toán hiện có để nâng cao độ chính xác và hiệu quả trong việc phân loại clickbait. Tóm lại, việc sử dụng phương pháp học máy để phân loại clickbait trong tiêu đề bài báo đã mang lại những kết quả tích cực. Tuy nhiên, cần tiếp tục nghiên cứu và phát triển để cải thiện hiệu quả và đáng tin cậy của phương pháp này. Điều này sẽ giúp loại bỏ những tin tức giật gân không chính xác và mang lại giá trị cao hơn cho người đọc khi tìm kiếm thông tin trên các trang tin tức. | en_US |
dc.format.medium | 65 tr. | en_US |
dc.language.iso | Vietnamese | en_US |
dc.publisher | Trường Đại học Kinh tế Tp. Hồ Chí Minh | - |
dc.subject | Học máy | en_US |
dc.subject | Clickbait | en_US |
dc.subject | Decision tree | en_US |
dc.subject | Random forest | en_US |
dc.subject | XGBoost | en_US |
dc.subject | Gradient boosting | en_US |
dc.subject | Logistic regression | en_US |
dc.subject | Support Vector machine | en_US |
dc.subject | Machine learning | en_US |
dc.title | Phân loại Clickbait cho tin tức tiếng Việt bằng phương pháp học máy | en_US |
dc.type | Master's Theses | en_US |
ueh.speciality | Information Design and Technology (by Coursework) = Công nghệ thiết kế thông tin và truyền thông (hướng ứng dụng) | en_US |
item.cerifentitytype | Publications | - |
item.fulltext | Full texts | - |
item.grantfulltext | reserved | - |
item.languageiso639-1 | Vietnamese | - |
item.openairetype | Master's Theses | - |
item.openairecristype | http://purl.org/coar/resource_type/c_18cf | - |
Appears in Collections: | MASTER'S THESES |
Files in This Item:
File
Description
Size
Format
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.