Title: | Ứng dụng Deep Learning trong phân loại chủ đề tin tức trên báo điện tử |
Author(s): | Phạm Minh Phương |
Advisor(s): | Dr. Đặng Ngọc Hoàng Thành |
Keywords: | Phân loại chủ đề; Mô hình học sâu; Topic classification; Deep learning model; Recurrent neural network; Long short-term memory; Gated recurrent unit; Bidirectional Long Short-Term memory; Convolutional neural networks |
Abstract: | Trong thời đại công nghiệp 4.0, một lượng thông tin khổng lồ trên Internet được sử dụng để phân tích, đánh giá và dự báo cho các tổ chức, doanh nghiệp đã cho thấy rằng dữ liệu đóng vai trò quan trọng trong đời sống hiện nay. Việc xác định và phân loại thông tin đã trở nên thiết yếu và các bài toán phân loại nội dung đã nhận được nhiều sự quan tâm trong trong lĩnh vực nghiên cứu về xử lý ngôn ngữ tự nhiên (NLP) trong những năm gần đây. Sự phức tạp và đa dạng của dữ liệu đã tạo ra một thách thức trong cách tiếp cận với các bài toán trong NLP và từ đó mở ra một xu hướng mới cho các nghiên cứu về học sâu (deep learning). Tiêu biểu là các bài toán phân loại nội dung văn bản dựa trên các kĩ thuật học sâu như CNN, RNN, các dẫn xuất của RNN như LSTM, BiLSTM, GRU được tác giả đề cập đến trong đề tài này, nhằm khai thác và so sánh hiệu năng của các mô hình học sâu trên dữ liệu tin tức trực tuyến. Kết quả cho thấy rằng, mô hình GRU cho precision, recall, F1-score và accuracy cao nhất lần lượt là 91.97%, 92.09%, 91.99% và 92.03%. Mặc khác, mặc dù mô hình CNN cho kết quả thấp nhất nhưng mức độ chênh lệch không quá lớn so với các mô hình còn lại, và ưu điểm nổi trội của CNN so với các mô hình còn lại là thời gian huấn luyện nhanh nhất và chỉ mất 670.626 giây. Với kết quả này, các doanh nghiệp hoặc tổ chức liên quan đến mảng tin tức, sách báo điện tử có thể áp dụng mô hình GRU trong việc phân loại nội dung. |
Issue Date: | 2023 |
Publisher: | Đại học Kinh tế TP. Hồ Chí Minh |
URI: | https://opac.ueh.edu.vn/record=b1036695~S1 https://digital.lib.ueh.edu.vn/handle/UEH/70794 |
Appears in Collections: | MASTER'S THESES
|