Đồ án sẽ là tiền đề cho các nghiên cứu sau về các giải pháp về tóm tắt đa văn bản. Trên cơ sở các nghiên cứu vào thực nghiệm của các công cụ đồ án tiến hành thực nghiệm tóm tắt đa văn bản trong tập 50 sự kiện chính trị giáo dục văn hóa, v.v. được truy vấn từ máy tìm kiếm Google. Bằng việc áp dụng hai quá trình phân cụm và nén câu đồ án tạo ra đoạn văn bản đầu ra thỏa mãn là kết quả của quá trình tóm tắt đa văn bản. Đồ án sử dụng một số phương pháp thuật toán như: K-Means, Yen algorithm, lý thuyết đồ thị, gán nhãn từ loại. Kết quả thực nghiệm ban đầu đã đạt được tính khả quan nhất định trong bước đầu nghiên cứu. Với số điểm cao nhất thu được là 2.44/4.0 đánh giá về ngữ pháp.
Hệ thống được xây dựng trên nền tảng java web application. Kiến trúc tổng thể của hệ thống được biểu diễn bởi hình dưới đây.
Application server sẽ cài đặt ứng dụng theo mô hình MVC. Mỗi khi người dùng gửi yêu cầu lên server từ trình duyệt. Lớp Servlet sẽ tiến hành phân tích yêu cầu của client để kết hợp với các lớp xử lý nghiệp vụ tương ứng và lớp thực thể trả lại kết quả mong muốn cho người dùng.
Nguồn: Sharecode.vn