Hệ thống hỏi đáp thông tin khoa học Tiếng Anh
Công nghệ sử dụng: Java, Swing, Lucene library, Stanford Parser library, kỹ thuật NLP, ...
1. Mục tiêu dự kiến chúng tôi đề ra cho hệ thống:
-
Hệ thống phải phân tích được các truy vấn Tiếng Anh dưới dạng ngôn ngữ tự nhiên do người dùng nhập vào.
-
Kết quả trả về cho người dùng là các câu trả lời được xếp hạng theo thứ tự độ chính xác giảm dần.
-
Hệ thống phải trả được các loại câu hỏi một cách nhanh chóng và chính xác.
2. Phạm vi đề tài
Do thời gian tìm hiểu cũng như thực hiện khóa luận có hạn, nên chúng tôi giới hạn lại phạm vi của đề tài như sau:
-
Hệ thống chỉ áp dụng cho một miền cụ thể là các thông tin khoa học trong trang web: seeker.com/topics/science.
-
Hệ thống chỉ xử lý các loại câu hỏi về: Person, Organization, Location, Date, Weight, Height, Distance, Duration.
-
Hệ thống chỉ xử lý các câu truy vấn Tiếng Anh có cấu trúc câu đơn.
-
Hệ thống chỉ xử lý các câu hỏi trực tiếp, không xử lý câu hỏi gián tiếp.
Nguồn: Sharecode.vn