--- language: vi tags: - vietnamese - text-classification - sentiment-analysis - PhoBERT - transformers license: mit datasets: - vanhai123/vietnamese-social-comments metrics: - accuracy - f1 model-index: - name: PhoBERT Vietnamese Comment Classifier (4-class) results: - task: type: text-classification name: Text Classification dataset: name: Vietnamese Social Comments type: vanhai123/vietnamese-social-comments metrics: - type: accuracy value: 0.86 - type: f1 name: f1_macro value: 0.83 --- # 📄 PhoBERT Vietnamese Comment Classifier (4-class) Đây là mô hình phân loại bình luận tiếng Việt thành 4 nhãn cảm xúc sử dụng `vinai/phobert-base`. ## 🍿️ Các nhãn phân loại * `positive` – tích cực * `negative` – tiêu cực * `neutral` – trung lập * `toxic` – kích động, phản cảm ## 🧠 Mô hình nền * **Base model**: [`vinai/phobert-base`](https://huggingface.co/vinai/phobert-base) * **Fine-tuned** trên dataset `vanhai123/vietnamese-social-comments` gồm 4,896 bình luận từ TikTok, Facebook, YouTube. ## 🧪 Kết quả đánh giá * Accuracy: **86%** * Macro F1-score: **83%** ## 💻 Sử dụng ```python from transformers import pipeline classifier = pipeline("text-classification", model="vanhai123/phobert-vi-comment-4class") classifier("Video này thật sự rất bổ ích và thú vị!") ``` ## 📾 Dataset * [Vietnamese Social Comments dataset](https://huggingface.co/datasets/vanhai123/vietnamese-social-comments) ## 👤 Tác giả * Hà Văn Hải – [vanhai11203@gmail.com](mailto:vanhai11203@gmail.com) * Hugging Face: [vanhai123](https://huggingface.co/vanhai123) ##