Advanced
Please use this identifier to cite or link to this item: https://digital.lib.ueh.edu.vn/handle/UEH/72984
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorDr. Ngô Tấn Vũ Khanhen_US
dc.contributor.authorLê Anh Quốcen_US
dc.date.accessioned2024-11-21T07:14:28Z-
dc.date.available2024-11-21T07:14:28Z-
dc.date.issued2024-
dc.identifier.otherBarcode: 1000021703-
dc.identifier.urihttps://opac.ueh.edu.vn/record=b1037784~S1-
dc.identifier.urihttps://digital.lib.ueh.edu.vn/handle/UEH/72984-
dc.description.abstractTrong thời đại hiện đại, mạng xã hội – nơi mà mọi người có thể tự do chia sẻ thông tin – việc phân tích phản hồi đã trở thành một công cụ vô cùng quan trọng để giúp môi trường mạng trở nên trong sáng và tránh xa những thông tin nhiễu và có hại. Nghiên cứu này giới thiệu một phương pháp để phát hiện và phân loại các ý kiến quảng cáo không mong muốn trên các kênh YouTube về lĩnh vực y tế, áp dụng các phương pháp xử lý ngôn ngữ tự nhiên (NLP) và các mô hình học sâu. Hệ thống được phát triển bao gồm các bước thu thập, tiền xử lý, đánh nhãn và phân tích dữ liệu bình luận từ các chương trình về lĩnh vực y tế trên YouTube. Dữ liệu được lấy từ API của YouTube và trải qua các phương pháp chuẩn hóa và đánh dấu bằng tay. Mang lại độ phức tạp của tiếng Việt, việc nghiên cứu sử dụng phoBERT – một mô hình ngôn ngữ được huấn luyện trước đặc biệt cho tiếng Việt – kết hợp với kiến trúc TextCNN và BiLSTM, giúp mô hình thu thập thông tin về cả ngữ cảnh cục bộ và thông tin tuần tự trong các bình luận. Phương pháp của việc phân loại bình luận thành hai nhóm là phân biệt giữa bình luận không phải là spam và bình luận spam. Bằng cách kết hợp các đặc điểm của các mô hình học sâu, phương pháp đề xuất đã cải thiện đáng kể độ chính xác trong việc phát hiện thông tin spam, đảm bảo tính toàn vẹn của thông tin chia sẻ trong các video y tế và bảo vệ người dùng khỏi những nội dung gian lận hoặc không chính xác. Kết quả của đề tài này đóng góp vào việc tiến triển các hệ thống loại bỏ thư spam một cách hiệu quả hơn, cung cấp các phương tiện hữu ích trong việc bảo vệ thông tin y tế trên các nền tảng số hóa. Nghiên cứu này cũng mở ra nhiều khả năng phát triển trong tương lai, bao gồm việc tích hợp thêm các mô hình khác, phân loại trực tuyến với dữ liệu khổng lồ và có thể phân loại ở nhiều lĩnh vực khác ngoài lĩnh vực y tế..en_US
dc.format.medium49 tr.en_US
dc.language.isovien_US
dc.publisherĐại học Kinh tế Thành phố Hồ Chí Minhen_US
dc.subjectBình luận spamen_US
dc.subjectNền tảng Youtubeen_US
dc.subjectHọc sâu kết hợpen_US
dc.subjectKênh Y tếen_US
dc.subjectSpam commenten_US
dc.subjectYouTube platformen_US
dc.subjectHybrid learningen_US
dc.subjectHealthcareen_US
dc.titlePhân loại bình luận spam trên youtube trong lĩnh vực y tế bằng phương pháp học sâu kết hợpen_US
dc.typeMaster’s Projecten_US
ueh.specialityInformation Design and Technology (by Coursework) = Công nghệ thiết kế thông tin và truyền thông (hướng ứng dụng)en_US
item.cerifentitytypePublications-
item.fulltextFull texts-
item.grantfulltextreserved-
item.languageiso639-1vi-
item.openairetypeMaster’s Project-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
Appears in Collections:MASTER'S PROJECTS
Files in This Item:

File

Description

Size

Format

Show simple item record

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.