Tên đề tài:
Khai phá mẫu dãy có trọng số trong cơ sở dữ liệu dãy
Ngành:
Máy tính, Chuyên ngành: Hệ thống thông tin, Mã số: 62 48 01 04
Tóm tắt nội dung tài liệu:
Luận án Tiến sĩ này tập trung vào việc giải quyết bài toán khai phá mẫu dãy thường xuyên có trọng số và mẫu dãy lợi ích cao trong cơ sở dữ liệu dãy, đặc biệt khi có thêm yếu tố khoảng cách thời gian giữa các dữ liệu. Các nghiên cứu trước đây thường chỉ xem xét một trong các yếu tố: trọng số, định lượng hoặc khoảng cách thời gian, mà chưa kết hợp đồng thời các yếu tố này.
Luận án đề xuất các thuật toán mới để khai phá các mẫu dãy có trọng số trong cơ sở dữ liệu dãy có khoảng cách thời gian, cũng như khai phá các mẫu dãy lợi ích cao trong cơ sở dữ liệu dãy định lượng có khoảng cách thời gian. Cụ thể:
- Đề xuất 01 thuật toán khai phá top-k mẫu dãy có tính đến trọng số của các mục và khoảng cách thời gian trong các CSDL dãy có khoảng cách thời gian.
- Đề xuất 02 thuật toán khai phá mẫu dãy lợi ích cao có tính đến trọng số của các mục, giá trị định lượng của mỗi mục và khoảng cách thời gian trong các CSDL dãy định lượng có khoảng cách thời gian.
Nghiên cứu bao gồm việc chứng minh tính đúng đắn, tính đầy đủ, phân tích độ phức tạp tính toán của các thuật toán, cũng như thực nghiệm và phân tích ý nghĩa của các mẫu dãy được khai phá.
Mục lục chi tiết:
- Phần mở đầu: Tổng quan, mục tiêu, đối tượng, phạm vi nghiên cứu, phương pháp, đóng góp và cấu trúc luận án.
- Chương 1: Tổng quan tình hình nghiên cứu và các định nghĩa về khai phá mẫu dãy có trọng số, mẫu dãy định lượng, và mẫu dãy có khoảng cách thời gian.
- Chương 2: Khai phá mẫu dãy có trọng số trong CSDL dãy có khoảng cách thời gian, đề xuất thuật toán khai phá top-k mẫu dãy thường xuyên trọng số và thực nghiệm.
- Chương 3: Khai phá mẫu dãy lợi ích cao trong CSDL dãy định lượng có khoảng cách thời gian, đề xuất thuật toán và thực nghiệm.
- Phần kết luận: Đóng góp, hướng phát triển và các vấn đề quan tâm.