Advanced
Please use this identifier to cite or link to this item: https://digital.lib.ueh.edu.vn/handle/UEH/69207
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorDr. Ngô Tấn Vũ Khanhen_US
dc.contributor.authorNguyễn Huy Khoaen_US
dc.date.accessioned2023-08-30T07:09:27Z-
dc.date.available2023-08-30T07:09:27Z-
dc.date.issued2023-
dc.identifier.otherBarcode: 1000015890-
dc.identifier.urihttps://opac.ueh.edu.vn/record=b1035386~S1-
dc.identifier.urihttps://digital.lib.ueh.edu.vn/handle/UEH/69207-
dc.description.abstractTrong bài luận văn này, học viên đã trình bày tổng quan về các vấn đề liên quan đến khái niệm, phân loại, tính chất và cách xác định clickbait trong tiêu đề bài báo. Để giải quyết vấn đề này, đã sử dụng phương pháp học máy với 6 thuật toán khác nhau: Logistic Regression (LR), Decision Tree (TREE), Support Vector Machine (SVM), XGBoost (XGB), Random Forest (RF) và Gradient Boosting (GB). Kết quả cho thấy thuật toán Random Forest cho hiệu suất phân loại cao nhất, với giá trị F1-Score trung bình là 0.83. Trong khi đó, thuật toán SVM cho thấy hiệu suất phân loại thấp nhất, với giá trị F1-Score là 0.67. Hướng phát triển trong tương lai là tiếp tục nghiên cứu và phát triển các phương pháp học máy mới, cũng như cải tiến các thuật toán hiện có để nâng cao độ chính xác và hiệu quả trong việc phân loại clickbait. Tóm lại, việc sử dụng phương pháp học máy để phân loại clickbait trong tiêu đề bài báo đã mang lại những kết quả tích cực. Tuy nhiên, cần tiếp tục nghiên cứu và phát triển để cải thiện hiệu quả và đáng tin cậy của phương pháp này. Điều này sẽ giúp loại bỏ những tin tức giật gân không chính xác và mang lại giá trị cao hơn cho người đọc khi tìm kiếm thông tin trên các trang tin tức.en_US
dc.format.medium65 tr.en_US
dc.language.isoVietnameseen_US
dc.publisherTrường Đại học Kinh tế Tp. Hồ Chí Minh-
dc.subjectHọc máyen_US
dc.subjectClickbaiten_US
dc.subjectDecision treeen_US
dc.subjectRandom foresten_US
dc.subjectXGBoosten_US
dc.subjectGradient boostingen_US
dc.subjectLogistic regressionen_US
dc.subjectSupport Vector machineen_US
dc.subjectMachine learningen_US
dc.titlePhân loại Clickbait cho tin tức tiếng Việt bằng phương pháp học máyen_US
dc.typeMaster's Thesesen_US
ueh.specialityInformation Design and Technology (by Coursework) = Công nghệ thiết kế thông tin và truyền thông (hướng ứng dụng)en_US
item.grantfulltextreserved-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.openairetypeMaster's Theses-
item.cerifentitytypePublications-
item.fulltextFull texts-
item.languageiso639-1Vietnamese-
Appears in Collections:MASTER'S THESES
Files in This Item:

File

Description

Size

Format

Show simple item record

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.