Chuyên ngành kinh tế dữ liệu ứng dụng phần mềm knime kết hợp thuật toán phân lớp trong bài toàn dự đoán khách hàng rời bỏ dịch vụ ngân hàng
3. Mục đích nghiên cứu
3.1. Về lý thuyết
− Nghiên cứu các lý thuyết cơ bản về phần mềm KNIME, phân lớp dữ liệu trong lĩnh vực máy học (Machine Learning), từ đó xây dụng một mơ hình dự đốn khách hàng rời bỏ
− Biết cách xử lí dữ liệu trước khi xây dựng mơ hình dự đốn.
− Phân tích, tìm ra ngun nhân làm cho kết quả dự đốn có những biến động.
3.2. Về đối tượng
− Giúp người dùng thành thạo các tool, các thư viện trong phần mềm KNIME để áp dụng vào nhu cầu cơng việc. Từ đó giúp mọi người biết phân tích và quản lí dữ liệu một cách khoa học.
− Sử dụng các thuật toán phân lớp để dự đốn khách hàng có xu hướng rời bỏ khách hàng hay không
− Đưa ra các giải pháp tối ưu cho họat động marketing và giữ chân khách hàng ở lại
NỘI DUNG:
CHƯƠNG 1: CƠ SỞ LÝ LUẬN VỀ KHAI PHÁ TRI THỨC ............................ 1
1.1. Khám phá tri thức và khai phá dữ liệu..................................................... 1
1.2. Qúa trình hình thành khám phá tri thức và khai phá dữ liệu ............... 2
1.3. Các ứng dụng của khai phá dữ liệu ........................................................... 4
1.4. Các phương pháp khai phá dữ liệu ........................................................... 6
1.5. Lợi ích của khai phá dữ liệu..................................................................... 11
1.6. Những thách thức đối với khai phá dữ liệu ............................................ 12
CHƯƠNG 2: GIỚI THIỆU PHẦN MỀM KNIME VÀ CÁC THUẬT TOÁN SỬ
DỤNG TRONG DỰ ĐOÁN KHÁCH HÀNG RỜI BỎ NGÂN HÀNG ............ 15
2.1. Phần mềm khai phá dữ liệu KNIME ......................................................... 15
2.1.1. Giới thiệu phần mềm .............................................................................. 15
2.1.2. Qúa trình phát triển cơng cụ KNIME ..................................................... 15
2.1.3. Ưu điểm phần mềm ................................................................................ 17
2.1.4. Nhược điểm của phần mềm KNIME ...................................................... 17
2.1.5. Giao diện làm việc của KNIME ............................................................. 18
2.2. Thuật toán Cây quyết định (Decision Tree) .............................................. 19
2.2.1. Giới thiệu thuật toán ............................................................................... 19
2.2.2. Các kiểu cây quyết định ......................................................................... 20
2.2.3. Ưu điểm của thuật toán cây quyết định .................................................. 20
2.2.4. Nhược điểm của thuật toán Cây quyết định ........................................... 21
2.1.5. Xây dựng thuật toán cây quyết định ....................................................... 22
2.3. Thuật toán Rừng ngẫu nhiên (Random Forest) ....................................... 22
2.3.1. Giới thiệu thuật toán rừng ngẫu nhiên (Random Forest) ....................... 22
2.3.2. Ưu điểm thuật toán Rừng ngẫu nhiên..................................................... 23
2.3.3. Nhược điểm thuật toán ........................................................................... 23
2.3.4. Xây dựng thuật toán rừng ngẫu nhiên .................................................... 23
2.4. Thuật tốn Nạve Bayes .............................................................................. 24
2.4.1. Giới thiệu thuật tốn Nạve Bayes .......................................................... 24
2.4.2. Ưu điểm thuật toán ................................................................................. 24
2.4.3. Nhược điểm thuật toán ........................................................................... 24
2.4.4. Ứng dụng thuật tốn Nạve Bayes .......................................................... 25
2.5. Thuật tốn Logistic Regression .................................................................. 25
2.5.1. Giới thiệu thuật toán Logistic Regression .............................................. 25
2.5.2. Ưu điểm của thuật toán........................................................................... 26
2.5.3. Nhược điểm của thuật toán ..................................................................... 27
2.5.3. Ứng dụng thuật toán Logistic Regression .............................................. 27
2.6. Phương pháp đánh giá ................................................................................ 28
2.6.1. ROC Curve ............................................................................................. 28
2.6.2. Ma trận nhầm lẫn (Confusion Matrix) ................................................... 29
CHƯƠNG 3: THỰC NGHIỆM VÀ KẾT QUẢ .................................................. 32
3.1. Tổng quan nghiên cứu................................................................................. 32
3.1.1. Giới thiệu bài toán .................................................................................. 32
3.1.2. Các nghiên cứu liên quan ....................................................................... 32
3.2. Chuẩn bị dữ liệu .......................................................................................... 34
3.2.1. Mô tả dữ liệu........................................................................................... 34
3.2.2. Tiền xử lý dữ liệu ................................................................................... 36
3.2.3. Trực quan hóa dữ liệu ............................................................................. 39
3.3 Xây dựng mơ hình ........................................................................................ 49
3.3.1. Thuật tốn Cây quyết định (Decision Tree) ........................................... 51
3.3.2. Thuật toán Rừng ngẫu nhiên (Random Forest) ...................................... 51
3.3.3. Thuật tốn Nạve Bayes.......................................................................... 52
3.3.4. Thuật tốn Logistic Regression .............................................................. 53
3.3.5. Lựa chọn mơ hình ................................................................................... 53
3.3.6. Chạy kiểm mơ hình trên tập dữ liệu thật ................................................ 54
3.4. Đánh giá & Kết luận.................................................................................... 56
3.5. Khuyến nghị ................................................................................................. 58
KẾT LUẬN ............................................................................................................. 60
TÀI LIỆU THAM KHẢO
LINK ĐẶT MUA TÀI LIỆU ONLINE
LINK ĐẶT MUA TÀI LIỆU ONLINE 1
LINK DOWNLOAD(UPDATING...)
3. Mục đích nghiên cứu
3.1. Về lý thuyết
− Nghiên cứu các lý thuyết cơ bản về phần mềm KNIME, phân lớp dữ liệu trong lĩnh vực máy học (Machine Learning), từ đó xây dụng một mơ hình dự đốn khách hàng rời bỏ
− Biết cách xử lí dữ liệu trước khi xây dựng mơ hình dự đốn.
− Phân tích, tìm ra ngun nhân làm cho kết quả dự đốn có những biến động.
3.2. Về đối tượng
− Giúp người dùng thành thạo các tool, các thư viện trong phần mềm KNIME để áp dụng vào nhu cầu cơng việc. Từ đó giúp mọi người biết phân tích và quản lí dữ liệu một cách khoa học.
− Sử dụng các thuật toán phân lớp để dự đốn khách hàng có xu hướng rời bỏ khách hàng hay không
− Đưa ra các giải pháp tối ưu cho họat động marketing và giữ chân khách hàng ở lại
NỘI DUNG:
CHƯƠNG 1: CƠ SỞ LÝ LUẬN VỀ KHAI PHÁ TRI THỨC ............................ 1
1.1. Khám phá tri thức và khai phá dữ liệu..................................................... 1
1.2. Qúa trình hình thành khám phá tri thức và khai phá dữ liệu ............... 2
1.3. Các ứng dụng của khai phá dữ liệu ........................................................... 4
1.4. Các phương pháp khai phá dữ liệu ........................................................... 6
1.5. Lợi ích của khai phá dữ liệu..................................................................... 11
1.6. Những thách thức đối với khai phá dữ liệu ............................................ 12
CHƯƠNG 2: GIỚI THIỆU PHẦN MỀM KNIME VÀ CÁC THUẬT TOÁN SỬ
DỤNG TRONG DỰ ĐOÁN KHÁCH HÀNG RỜI BỎ NGÂN HÀNG ............ 15
2.1. Phần mềm khai phá dữ liệu KNIME ......................................................... 15
2.1.1. Giới thiệu phần mềm .............................................................................. 15
2.1.2. Qúa trình phát triển cơng cụ KNIME ..................................................... 15
2.1.3. Ưu điểm phần mềm ................................................................................ 17
2.1.4. Nhược điểm của phần mềm KNIME ...................................................... 17
2.1.5. Giao diện làm việc của KNIME ............................................................. 18
2.2. Thuật toán Cây quyết định (Decision Tree) .............................................. 19
2.2.1. Giới thiệu thuật toán ............................................................................... 19
2.2.2. Các kiểu cây quyết định ......................................................................... 20
2.2.3. Ưu điểm của thuật toán cây quyết định .................................................. 20
2.2.4. Nhược điểm của thuật toán Cây quyết định ........................................... 21
2.1.5. Xây dựng thuật toán cây quyết định ....................................................... 22
2.3. Thuật toán Rừng ngẫu nhiên (Random Forest) ....................................... 22
2.3.1. Giới thiệu thuật toán rừng ngẫu nhiên (Random Forest) ....................... 22
2.3.2. Ưu điểm thuật toán Rừng ngẫu nhiên..................................................... 23
2.3.3. Nhược điểm thuật toán ........................................................................... 23
2.3.4. Xây dựng thuật toán rừng ngẫu nhiên .................................................... 23
2.4. Thuật tốn Nạve Bayes .............................................................................. 24
2.4.1. Giới thiệu thuật tốn Nạve Bayes .......................................................... 24
2.4.2. Ưu điểm thuật toán ................................................................................. 24
2.4.3. Nhược điểm thuật toán ........................................................................... 24
2.4.4. Ứng dụng thuật tốn Nạve Bayes .......................................................... 25
2.5. Thuật tốn Logistic Regression .................................................................. 25
2.5.1. Giới thiệu thuật toán Logistic Regression .............................................. 25
2.5.2. Ưu điểm của thuật toán........................................................................... 26
2.5.3. Nhược điểm của thuật toán ..................................................................... 27
2.5.3. Ứng dụng thuật toán Logistic Regression .............................................. 27
2.6. Phương pháp đánh giá ................................................................................ 28
2.6.1. ROC Curve ............................................................................................. 28
2.6.2. Ma trận nhầm lẫn (Confusion Matrix) ................................................... 29
CHƯƠNG 3: THỰC NGHIỆM VÀ KẾT QUẢ .................................................. 32
3.1. Tổng quan nghiên cứu................................................................................. 32
3.1.1. Giới thiệu bài toán .................................................................................. 32
3.1.2. Các nghiên cứu liên quan ....................................................................... 32
3.2. Chuẩn bị dữ liệu .......................................................................................... 34
3.2.1. Mô tả dữ liệu........................................................................................... 34
3.2.2. Tiền xử lý dữ liệu ................................................................................... 36
3.2.3. Trực quan hóa dữ liệu ............................................................................. 39
3.3 Xây dựng mơ hình ........................................................................................ 49
3.3.1. Thuật tốn Cây quyết định (Decision Tree) ........................................... 51
3.3.2. Thuật toán Rừng ngẫu nhiên (Random Forest) ...................................... 51
3.3.3. Thuật tốn Nạve Bayes.......................................................................... 52
3.3.4. Thuật tốn Logistic Regression .............................................................. 53
3.3.5. Lựa chọn mơ hình ................................................................................... 53
3.3.6. Chạy kiểm mơ hình trên tập dữ liệu thật ................................................ 54
3.4. Đánh giá & Kết luận.................................................................................... 56
3.5. Khuyến nghị ................................................................................................. 58
KẾT LUẬN ............................................................................................................. 60
TÀI LIỆU THAM KHẢO
LINK ĐẶT MUA TÀI LIỆU ONLINE
LINK ĐẶT MUA TÀI LIỆU ONLINE 1
LINK DOWNLOAD(UPDATING...)

%20(1).png)

.png)
Không có nhận xét nào: