Vietnamese Emotion Classification using PhoBERT
Input:
- Sentence
Output:
* enjoyment (vui vẻ)
* disgust (ghê tởm)
* sadness (buồn)
* anger (giận dữ)
* surprise (ngạc nhiên)
* fear (sợ hãi)
* others (khác)
Mục tiêu chính của dự án này là phát triển mô hình machine learning có khả năng phân loại tình cảm ở trong văn bản tiếng Việt bằng PhoBERT. Cụ thể, các mục tiêu phụ bao gồm:
- Thu thập và chuẩn bị bộ dữ liệu chứa các văn bản tiếng Việt có gắn nhãn cảm xúc.
- Tiền xử lý dữ liệu văn bản để loại bỏ nhiễu và chuẩn hóa.
- Biểu diễn văn bản dưới dạng vectơ ngôn ngữ bằng PhoBERT.
- Huấn luyện mô hình phân loại cảm tính sử dụng dữ liệu do PhoBERT đại diện.
- Đánh giá hiệu năng của mô hình trên tập dữ liệu thử nghiệm.
Phạm vi của dự án sẽ tập trung xây dựng và đánh giá các mô hình phân loại cảm xúc, tập trung vào những cảm xúc phổ biến. Chủ đề này không nhằm mục đích đi sâu vào xử lý dữ liệu lớn hoặc xem xét các khía cạnh như cú pháp hoặc ngữ nghĩa của ngôn ngữ.
XEM THÊM ==> Hướng dẫn cài đặt chi tiết
Nguồn: Sharecode.vn
Đưa code lên driver và chạy file XLNNTN.ipynb bằng gg colab