Code nhận diện chủ đề bài báo - Python

[Mã code 27917]
  1 Đánh giá    Viết đánh giá
 7      1797      6
Phí tải: 20 Xu (1Xu = 1.000đ)
Danh mục
Thể loại
Nhóm code
Ngày đăng
18-3-2021
Loại file
Full code
Dung lượng
15 MB

Đề tài: Xây dựng hệ thống nhận dạng chủ đề bài báo (từ các trang báo như: dantri, vnexpress, ...) bằng học máy.


MÔ TẢ CHI TIẾT

Đây là đồ án của mình, trong đồ án này mình đã crawl 10000 bài báo từ vnexpress thuộc 10 chủ đề khác nhau sau đó lưu vào file data.txt. Tiếp tục mình xử lý để loại bỏ các kí tự đặc biệt như (,.!@#...) để làm sạch dữ liệu.

Sau khi đã làm sạch dữ liệu, mình tiếp tục tách các từ để có thể train model. Ví dụ như từ hội đồng => hội_đồng.

Sau khi train model thì mình có thể nhập link của nhiều bài báo sau đó chương trình sẽ dự đoán chủ đề của bài báo đó.

 


XEM THÊM ==> Hướng dẫn cài đặt chi tiết

 

HÌNH ẢNH DEMO

Python,Nhận diện text,Crawl data,học máy machine learning

Python,Nhận diện text,Crawl data,học máy machine learning

Python,Nhận diện text,Crawl data,học máy machine learning

Nguồn: Sharecode.vn



HƯỚNG DẪN CÀI ĐẶT

Các bạn xem trong README.md mình có hướng dẫn chi tiết. Nếu vẫn không chạy được các bạn có thể liên hệ mình qua email vovantam.dev@gmail.com. Mình xin cám ơn!

 
 
LINK DOWNLOAD

code.zip [15 MB]

File đã kiểm duyệt
     Báo vi phạm bản quyền
Pass giải nén (Nếu có):
sharecode.vn
DOWNLOAD
(20 Xu)
Bạn có code hay
ĐĂNG BÁN NGAY

BÌNH LUẬN



ĐÁNH GIÁ


ĐIỂM TRUNG BÌNH

5
1 Đánh giá
Code rất tốt (1)
Code tốt (0)
Code rất hay (0)
Code hay (0)
Bình thường (0)
Thành viên
Nội dung đánh giá
15:37 - 18/3/2021
Code rất tốt
Code rất tốt và phù hợp để phát triển

 HỖ TRỢ TRỰC TUYẾN