Phân loại bình luận spam trên youtube trong lĩnh vực y tế bằng phương pháp học sâu kết hợp

Lê Anh Quốc

Please use this identifier to cite or link to this item: https://digital.lib.ueh.edu.vn/handle/UEH/72984

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Dr. Ngô Tấn Vũ Khanh	en_US
dc.contributor.author	Lê Anh Quốc	en_US
dc.date.accessioned	2024-11-21T07:14:28Z	-
dc.date.available	2024-11-21T07:14:28Z	-
dc.date.issued	2024	-
dc.identifier.other	Barcode: 1000021703	-
dc.identifier.uri	https://opac.ueh.edu.vn/record=b1037784~S1	-
dc.identifier.uri	https://digital.lib.ueh.edu.vn/handle/UEH/72984	-
dc.description.abstract	Trong thời đại hiện đại, mạng xã hội – nơi mà mọi người có thể tự do chia sẻ thông tin – việc phân tích phản hồi đã trở thành một công cụ vô cùng quan trọng để giúp môi trường mạng trở nên trong sáng và tránh xa những thông tin nhiễu và có hại. Nghiên cứu này giới thiệu một phương pháp để phát hiện và phân loại các ý kiến quảng cáo không mong muốn trên các kênh YouTube về lĩnh vực y tế, áp dụng các phương pháp xử lý ngôn ngữ tự nhiên (NLP) và các mô hình học sâu. Hệ thống được phát triển bao gồm các bước thu thập, tiền xử lý, đánh nhãn và phân tích dữ liệu bình luận từ các chương trình về lĩnh vực y tế trên YouTube. Dữ liệu được lấy từ API của YouTube và trải qua các phương pháp chuẩn hóa và đánh dấu bằng tay. Mang lại độ phức tạp của tiếng Việt, việc nghiên cứu sử dụng phoBERT – một mô hình ngôn ngữ được huấn luyện trước đặc biệt cho tiếng Việt – kết hợp với kiến trúc TextCNN và BiLSTM, giúp mô hình thu thập thông tin về cả ngữ cảnh cục bộ và thông tin tuần tự trong các bình luận. Phương pháp của việc phân loại bình luận thành hai nhóm là phân biệt giữa bình luận không phải là spam và bình luận spam. Bằng cách kết hợp các đặc điểm của các mô hình học sâu, phương pháp đề xuất đã cải thiện đáng kể độ chính xác trong việc phát hiện thông tin spam, đảm bảo tính toàn vẹn của thông tin chia sẻ trong các video y tế và bảo vệ người dùng khỏi những nội dung gian lận hoặc không chính xác. Kết quả của đề tài này đóng góp vào việc tiến triển các hệ thống loại bỏ thư spam một cách hiệu quả hơn, cung cấp các phương tiện hữu ích trong việc bảo vệ thông tin y tế trên các nền tảng số hóa. Nghiên cứu này cũng mở ra nhiều khả năng phát triển trong tương lai, bao gồm việc tích hợp thêm các mô hình khác, phân loại trực tuyến với dữ liệu khổng lồ và có thể phân loại ở nhiều lĩnh vực khác ngoài lĩnh vực y tế..	en_US
dc.format.medium	49 tr.	en_US
dc.language.iso	vi	en_US
dc.publisher	Đại học Kinh tế Thành phố Hồ Chí Minh	en_US
dc.subject	Bình luận spam	en_US
dc.subject	Nền tảng Youtube	en_US
dc.subject	Học sâu kết hợp	en_US
dc.subject	Kênh Y tế	en_US
dc.subject	Spam comment	en_US
dc.subject	YouTube platform	en_US
dc.subject	Hybrid learning	en_US
dc.subject	Healthcare	en_US
dc.title	Phân loại bình luận spam trên youtube trong lĩnh vực y tế bằng phương pháp học sâu kết hợp	en_US
dc.type	Master’s Project	en_US
ueh.speciality	Information Design and Technology (by Coursework) = Công nghệ thiết kế thông tin và truyền thông (hướng ứng dụng)	en_US
item.fulltext	Full texts	-
item.grantfulltext	reserved	-
item.openairetype	Master’s Project	-
item.languageiso639-1	vi	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
item.cerifentitytype	Publications	-
Appears in Collections:	MASTER'S PROJECTS

Files in This Item:

File

Lê Anh Quốc.pdf

Description

Size

1.01 MB

Format

Adobe PDF

Show simple item record

Google Scholar^TM

Check

Files in This Item:

Google ScholarTM

Google Scholar^TM