ĐỀ TÀI MÔN HỌC THUẬT TOÁN NÂNG CAO - CÂY QUYẾT ĐỊNH VÀ THUẬT TOÁN XÂY DỰNG CÂY QUYẾT ĐỊNH (Ứng dụng thoật toán ID3) (Huỳnh Phước Thái)



Với các nhà đầu tư tài chính, họ thường xuyên phải ra các quyết định liên quan đến quá trình đầu tư của mình. Dù rằng họ luôn mong muốn những quyết định của mình là chính xác nhưng thực tế thì không phải lúc nào cũng được như thế. Rủi ro là một điều hoàn toàn có thể xảy ra đi kèm với những quyết định đầu tư. Như vậy, vấn đề không chỉ ở chỗ là ra quyết định đúng mà còn là kiểm soát được các rủi ro liên quan sao cho có thể tối thiểu hoá những thiệt hại có thể gặp phải. 

Trong những năm gầy đây các nhà quản lý đã sử dụng phương pháp và kỹ thuật suy luận thống kê để giải quyết nhiều vấn đề mà thông tin nó bị thiếu, bất định, hoặc một số trường hợp hầu như thiếu hoàn chỉnh. Lĩnh vực thống kê mới này có tên gọi: Lý thuyết quyết định thống kê hoặc đơn giản là Lý thuyết quyết định. Lý thuyết này là công cụ khoa học nhất mà các nhà quản lý cần hiểu biết và dùng để ra quyết định. 

Trong lý thuyết quyết định, một cây quyết định (decision tree) là một đồ thị của các quyết định và các hậu quả có thể có của nó (bao gồm rủi ro và hao phí tài nguyên). Cây quyết định được sử dụng để xây dựng một kế hoạch nhằm đạt được mục tiêu mong muốn. Các cây quyết định được dùng để hỗ trợ quá trình ra quyết định. Cây quyết định là một dạng đặc biệt của cấu trúc cây.

Trong khuôn khổ báo cáo này chúng em xin trình bày những vấn đề cơ bản về cơ sở lý thuyết cây quyết định và xây dựng cây quyết định ứng dụng thoật toán ID3.


NỘI DUNG:


MỤC LỤC ………………………………………………………………………………2

Chương 1 CƠ SỞ LÝ THUYẾT 6

1.1. Giới thiệu chung 6

1.2. Các kiểu cây quyết định 8

1.3. Ví dụ 8

1.4. Ưu điểm của cây quyết định 11

Chương 2 XÂY DỰNG CÂY QUYẾT ĐỊNH ỨNG DỤNG THUẬT TOÁN ID3 13

2.1. Giới thiệu 13

2.2. Giải thuật ID3 xây dựng cây quyết định 14

2.3. Thuộc tính nào là thuộc tính dùng để phân loại tốt nhất? 15

2.4. Entropy đo tính thuần nhất của tập ví dụ 15

2.5. Lượng thông tin thu được đo mức độ giảm entropy mong đợi 17

2.6. Tìm kiếm không gian giả thuyết trong ID3 17

2.7. Đánh giá hiệu suất của cây quyết định 19

2.8. Ví dụ minh họa 19

Chương 3 DEMO Với DecisionTreeApplet_3.20 33

KẾT LUẬN ……………………………………………………………………………..35

TÀI LIỆU THAM KHẢO 36






Với các nhà đầu tư tài chính, họ thường xuyên phải ra các quyết định liên quan đến quá trình đầu tư của mình. Dù rằng họ luôn mong muốn những quyết định của mình là chính xác nhưng thực tế thì không phải lúc nào cũng được như thế. Rủi ro là một điều hoàn toàn có thể xảy ra đi kèm với những quyết định đầu tư. Như vậy, vấn đề không chỉ ở chỗ là ra quyết định đúng mà còn là kiểm soát được các rủi ro liên quan sao cho có thể tối thiểu hoá những thiệt hại có thể gặp phải. 

Trong những năm gầy đây các nhà quản lý đã sử dụng phương pháp và kỹ thuật suy luận thống kê để giải quyết nhiều vấn đề mà thông tin nó bị thiếu, bất định, hoặc một số trường hợp hầu như thiếu hoàn chỉnh. Lĩnh vực thống kê mới này có tên gọi: Lý thuyết quyết định thống kê hoặc đơn giản là Lý thuyết quyết định. Lý thuyết này là công cụ khoa học nhất mà các nhà quản lý cần hiểu biết và dùng để ra quyết định. 

Trong lý thuyết quyết định, một cây quyết định (decision tree) là một đồ thị của các quyết định và các hậu quả có thể có của nó (bao gồm rủi ro và hao phí tài nguyên). Cây quyết định được sử dụng để xây dựng một kế hoạch nhằm đạt được mục tiêu mong muốn. Các cây quyết định được dùng để hỗ trợ quá trình ra quyết định. Cây quyết định là một dạng đặc biệt của cấu trúc cây.

Trong khuôn khổ báo cáo này chúng em xin trình bày những vấn đề cơ bản về cơ sở lý thuyết cây quyết định và xây dựng cây quyết định ứng dụng thoật toán ID3.


NỘI DUNG:


MỤC LỤC ………………………………………………………………………………2

Chương 1 CƠ SỞ LÝ THUYẾT 6

1.1. Giới thiệu chung 6

1.2. Các kiểu cây quyết định 8

1.3. Ví dụ 8

1.4. Ưu điểm của cây quyết định 11

Chương 2 XÂY DỰNG CÂY QUYẾT ĐỊNH ỨNG DỤNG THUẬT TOÁN ID3 13

2.1. Giới thiệu 13

2.2. Giải thuật ID3 xây dựng cây quyết định 14

2.3. Thuộc tính nào là thuộc tính dùng để phân loại tốt nhất? 15

2.4. Entropy đo tính thuần nhất của tập ví dụ 15

2.5. Lượng thông tin thu được đo mức độ giảm entropy mong đợi 17

2.6. Tìm kiếm không gian giả thuyết trong ID3 17

2.7. Đánh giá hiệu suất của cây quyết định 19

2.8. Ví dụ minh họa 19

Chương 3 DEMO Với DecisionTreeApplet_3.20 33

KẾT LUẬN ……………………………………………………………………………..35

TÀI LIỆU THAM KHẢO 36




M_tả

M_tả

Không có nhận xét nào: