Source code ứng dụng thuật toán kmeans trong phân cụm file text chứa dữ liệu:
- Chọn dữ liệu đầu vào là file text trong file text chứa các câu.
- Chọn thư mục chứa kết quả đầu ra
- Chọn số cụm cần phần chia.
- Áp dụng thuạt toán kmean vào để phân chia các file trong thư mục đầu vào thành các nhóm.
- Chương trình vector hóa dữ liệu trong file text để áp dụng được thuật toán kmeans, tìm tâm và phân cụm.
XEM THÊM ==> Hướng dẫn cài đặt chi tiết
Nguồn: Sharecode.vn
- Chạy chương trình trong thư mục bin.
- Chọn đầu vào là thư mục docs đã có sẵn file dữ liệu mẫu.