Trích chọn sự kiện tai nạn giao thông trong văn bản tin tức tiếng Việt


Trích chọn thông tin (Information Extraction - IE) là một lĩnh vực quan trọng trong khai phá dữ liệu và học máy (Data mining and machine learning) có nhiều ứng dụng trong thực tiễn với mục tiêu là trích lọc các thông tin có định dạng và hữu ích từ các nguồn dữ liệu lớn trên Internet [1, 2]. Trích chọn sự kiện (Event Extraction  –  EE) là bài toán con của trích chọn thông tin với mục tiêu là trích lọc ra các sự kiện từ các nguồn số liệu.

Đầu vào của trích chọn sự kiện là các văn bản lấy từ nhiều nguồn số liệu khác nhau như văn bản tin tức, mạng xã hội...đầu ra là các tri thức biểu diễn dưới dạng thông tin có cấu trúc. Những thông tin nay rất hữu ích cho việc khai thác dữ liệu như thống kê, giám sát, hỗ trợ ra quyết định. Trích chọn sự kiện có thể áp dụng cho một miền dữ liệu cụ thể như các vụ tai nạn giao thông, dịch bệnh, các tour du lịch...và có nhiều  ứng dụng trong các lĩnh vực khác nhau của đời sống xã hội như kinh tế, văn hóa, y tế, giáo dục…[3, 4, 5, 6, 7, 8].

LINK DOWNLOAD
M_tả

No comments: