NHẬN DIỆN BỆNH TRÊN LÁ DỰA TRÊN MẠNG NƠ RON TÍCH CHẬP
Trí tuệ nhân tạo (Artificial Intelligence – AI) đã chứng kiến sự phát triển vượt bậc trong việc thu hẹp khoảng cách giữa khả năng của con người và máy móc. Các nhà nghiên cứu và những người đam mê đã làm việc trên nhiều khía cạnh của lĩnh vực này để tạo ra những điều tuyệt vời. Một trong những khía cạnh như vậy là Computer Vision (Thị giác máy tính).
Mục tiêu của lĩnh vực này là cho phép máy móc nhìn thế giới giống như con người, nhận thức nó theo cách tương tự con người và thậm chí sử dụng kiến thức đó cho vơ số nhiệm vụ như nhận dạng hình ảnh và video, phân tích và phân loại hình ảnh, giải trí truyền thơng, hệ thống khuyến nghị (Recommendation System), xử lý ngôn ngữ tự nhiên (Natural Language Processing), … Những tiến bộ trong Thị giác máy tính với Học sâu (Deep Learning) đã được xây dựng và hoàn thiện theo thời gian, chủ yếu qua một thuật toán cụ thể - Mạng neuron tích chập (Convolutional Neural Network).
Từ những năm 2010, Học sâu (Deep Learning) và mạng neuron tích chập (CNN) đã thu hút sự quan tâm đặc biệt của cộng đồng nghiên cứu, và cho thấy những ưu điểm so với mạng neuron truyền thống. Ngày nay, mạng neuron nhiều lớp và Deep Learning đạt được những thành tích xuất sắc về việc giải quyết các vấn đề quan trọng trong lĩnh vực thị giác máy tính, nhận dạng giọng nói và xử lý ngơn ngữ tự nhiên. Và kỹ thuật này đã được áp dụng bởi nhiều công ty hàng đầu thế giới như Google, Microsoft hay Facebook.
Kiến trúc của neuron tích chập tương tự như mơ hình kết nối của các neuron trong bộ não con người và được lấy cảm hứng từ hệ thống vỏ thị giác trong bộ não (Visual Cortex). Các neuron riêng lẻ chỉ phản ứng với các kích thích trong một khu vực hạn chế của trường thị giác được gọi là Trường tiếp nhận (Receptive Field). Một tập hợp các trường như vậy chồng lên nhau để bao phủ toàn bộ khu vực thị giác. Đây là bước đệm đặt nền tảng để thực hiện các tác vụ phức tạp, cao cấp.
NỘI DUNG:
CHƯƠNG 1. TỔNG QUAN .........................................................................................3
1.1 Lý do chọn đề tài......................................................................................................3
1.2 Mục tiêu nghiên cứu đề tài .....................................................................................3
1.3 Đối tượng nghiên cứu .............................................................................................. 4
1.4 Phạm vi nghiên cứu .................................................................................................4
1.5 Phương pháp nghiên cứu ........................................................................................4
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT .............................................................................5
2.1 Deep Learning ..........................................................................................................5
2.1.1 Deep Learning là gì? .....................................................................................5
2.1.2 Cách thức hoạt động .....................................................................................6
2.2 Mơ hình CNN – Convolutional Neural Network ..................................................7
2.2.1 Convolutional là gì? ......................................................................................7
2.2.2 Cấu trúc mạng CNN .....................................................................................8
2.2.3 Hình ảnh đầu vào ........................................................................................10
2.2.4 Lớp tích chập ............................................................................................... 10
2.2.5 Lớp gộp (Pooling layer) ..............................................................................13
2.3 Tìm hiểu về các thư viện sử dụng trong đồ án ....................................................14
2.3.1 Tensorflow là gì? .........................................................................................14
2.3.2 Cách thức hoạt động của tensorflow .........................................................15
2.3.3 Giới thiệu về keras ......................................................................................16
2.3.4 Keras với linear regression .........................................................................17
2.3.5 Keras với logistic regression.......................................................................17
2.4 Nhận diện và phân loại hình ảnh .........................................................................18
2.4.1 Khái niệm về nhận diện ..............................................................................18
2.4.2 Phân loại hình ảnh là gì? ............................................................................18
I2.4.3 Các kỹ thuật phân loại hình ảnh................................................................ 19
2.4.3.1 Phân loại có giám sát ............................................................................19
2.4.3.2 Phân loại nhãn đơn...............................................................................19
2.4.3.3 Phân loại đa nhãn .................................................................................20
2.4.3.4 Phân loại video ......................................................................................20
2.4.3.5 Phân loại 3D ..........................................................................................20
2.4.4 Cách thức hoạt động ...................................................................................21
CHƯƠNG 3. BÀI TOÁN NHẬN DIỆN BỆNH TRÊN LÁ DỰA TRÊN MẠNG
NEURON TÍCH CHẬP .............................................................................................. 22
3.1 Mơ tả bài tốn ........................................................................................................22
3.2 Phương pháp nhận diện bệnh trên lá dựa trên mạng neuron tích chập (CNN)
.......................................................................................................................................23
3.2.1 Kiến trúc mạng neuron tích chập sâu AlexNet ........................................24
3.2.1.1 Giới thiệu về AlexNet ...........................................................................24
3.2.1.2 Kiến trúc mạng AlexNet ......................................................................25
3.2.2 Kiến trúc mạng sử dụng khối VGG ..........................................................26
3.2.2.1 Giới thiệu về mạng VGG .....................................................................26
3.2.2.2 Kiến trúc về mạng VGG16 ..................................................................26
3.3 Overfiting là gì? .....................................................................................................28
3.4 Data Augmentation ............................................................................................... 28
3.5 Một số công thức sử dụng trong đồ án: ............................................................... 29
3.5.1 Công thức tính accuracy function: ............................................................ 29
3.5.1 Công thức tính loss function: .....................................................................30
CHƯƠNG 4. THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ..................................31
4.1 Công cụ và môi trường thực hiện ........................................................................31
4.2 Dữ liệu chuẩn bị (dataset) .....................................................................................31
4.3 Tăng cường dữ liệu bằng data augmentation .....................................................33
4.4 Mơ hình train trong phần mềm: ..........................................................................37
4.5 Training ..................................................................................................................38
4.6 Xuất kết quả training ............................................................................................ 39
4.7 Kết quả thực nghiệm ............................................................................................. 40
4.8 So sánh độ chính xác mơ hình với mơ hình nghiên cứu khác ...........................44
II
4.9. So sánh kết quả với cùng mơ hình với cơng trình nghiên cứu khác: ...............45
CHƯƠNG 5: KẾT LUẬN VÀ KIẾN NGHỊ ............................................................. 47
5.1 Kết luận chung .......................................................................................................47
5.1.1 Ưu điểm:.......................................................................................................47
5.1.2 Nhược điểm: ................................................................................................ 47
5.2 Kiến nghị ................................................................................................................47
TÀI LIỆU THAM KHẢO
LINK ĐẶT MUA TÀI LIỆU ONLINE
LINK ĐẶT MUA TÀI LIỆU ONLINE 1
LINK DOWNLOAD (UPDATING...)
Trí tuệ nhân tạo (Artificial Intelligence – AI) đã chứng kiến sự phát triển vượt bậc trong việc thu hẹp khoảng cách giữa khả năng của con người và máy móc. Các nhà nghiên cứu và những người đam mê đã làm việc trên nhiều khía cạnh của lĩnh vực này để tạo ra những điều tuyệt vời. Một trong những khía cạnh như vậy là Computer Vision (Thị giác máy tính).
Mục tiêu của lĩnh vực này là cho phép máy móc nhìn thế giới giống như con người, nhận thức nó theo cách tương tự con người và thậm chí sử dụng kiến thức đó cho vơ số nhiệm vụ như nhận dạng hình ảnh và video, phân tích và phân loại hình ảnh, giải trí truyền thơng, hệ thống khuyến nghị (Recommendation System), xử lý ngôn ngữ tự nhiên (Natural Language Processing), … Những tiến bộ trong Thị giác máy tính với Học sâu (Deep Learning) đã được xây dựng và hoàn thiện theo thời gian, chủ yếu qua một thuật toán cụ thể - Mạng neuron tích chập (Convolutional Neural Network).
Từ những năm 2010, Học sâu (Deep Learning) và mạng neuron tích chập (CNN) đã thu hút sự quan tâm đặc biệt của cộng đồng nghiên cứu, và cho thấy những ưu điểm so với mạng neuron truyền thống. Ngày nay, mạng neuron nhiều lớp và Deep Learning đạt được những thành tích xuất sắc về việc giải quyết các vấn đề quan trọng trong lĩnh vực thị giác máy tính, nhận dạng giọng nói và xử lý ngơn ngữ tự nhiên. Và kỹ thuật này đã được áp dụng bởi nhiều công ty hàng đầu thế giới như Google, Microsoft hay Facebook.
Kiến trúc của neuron tích chập tương tự như mơ hình kết nối của các neuron trong bộ não con người và được lấy cảm hứng từ hệ thống vỏ thị giác trong bộ não (Visual Cortex). Các neuron riêng lẻ chỉ phản ứng với các kích thích trong một khu vực hạn chế của trường thị giác được gọi là Trường tiếp nhận (Receptive Field). Một tập hợp các trường như vậy chồng lên nhau để bao phủ toàn bộ khu vực thị giác. Đây là bước đệm đặt nền tảng để thực hiện các tác vụ phức tạp, cao cấp.
NỘI DUNG:
CHƯƠNG 1. TỔNG QUAN .........................................................................................3
1.1 Lý do chọn đề tài......................................................................................................3
1.2 Mục tiêu nghiên cứu đề tài .....................................................................................3
1.3 Đối tượng nghiên cứu .............................................................................................. 4
1.4 Phạm vi nghiên cứu .................................................................................................4
1.5 Phương pháp nghiên cứu ........................................................................................4
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT .............................................................................5
2.1 Deep Learning ..........................................................................................................5
2.1.1 Deep Learning là gì? .....................................................................................5
2.1.2 Cách thức hoạt động .....................................................................................6
2.2 Mơ hình CNN – Convolutional Neural Network ..................................................7
2.2.1 Convolutional là gì? ......................................................................................7
2.2.2 Cấu trúc mạng CNN .....................................................................................8
2.2.3 Hình ảnh đầu vào ........................................................................................10
2.2.4 Lớp tích chập ............................................................................................... 10
2.2.5 Lớp gộp (Pooling layer) ..............................................................................13
2.3 Tìm hiểu về các thư viện sử dụng trong đồ án ....................................................14
2.3.1 Tensorflow là gì? .........................................................................................14
2.3.2 Cách thức hoạt động của tensorflow .........................................................15
2.3.3 Giới thiệu về keras ......................................................................................16
2.3.4 Keras với linear regression .........................................................................17
2.3.5 Keras với logistic regression.......................................................................17
2.4 Nhận diện và phân loại hình ảnh .........................................................................18
2.4.1 Khái niệm về nhận diện ..............................................................................18
2.4.2 Phân loại hình ảnh là gì? ............................................................................18
I2.4.3 Các kỹ thuật phân loại hình ảnh................................................................ 19
2.4.3.1 Phân loại có giám sát ............................................................................19
2.4.3.2 Phân loại nhãn đơn...............................................................................19
2.4.3.3 Phân loại đa nhãn .................................................................................20
2.4.3.4 Phân loại video ......................................................................................20
2.4.3.5 Phân loại 3D ..........................................................................................20
2.4.4 Cách thức hoạt động ...................................................................................21
CHƯƠNG 3. BÀI TOÁN NHẬN DIỆN BỆNH TRÊN LÁ DỰA TRÊN MẠNG
NEURON TÍCH CHẬP .............................................................................................. 22
3.1 Mơ tả bài tốn ........................................................................................................22
3.2 Phương pháp nhận diện bệnh trên lá dựa trên mạng neuron tích chập (CNN)
.......................................................................................................................................23
3.2.1 Kiến trúc mạng neuron tích chập sâu AlexNet ........................................24
3.2.1.1 Giới thiệu về AlexNet ...........................................................................24
3.2.1.2 Kiến trúc mạng AlexNet ......................................................................25
3.2.2 Kiến trúc mạng sử dụng khối VGG ..........................................................26
3.2.2.1 Giới thiệu về mạng VGG .....................................................................26
3.2.2.2 Kiến trúc về mạng VGG16 ..................................................................26
3.3 Overfiting là gì? .....................................................................................................28
3.4 Data Augmentation ............................................................................................... 28
3.5 Một số công thức sử dụng trong đồ án: ............................................................... 29
3.5.1 Công thức tính accuracy function: ............................................................ 29
3.5.1 Công thức tính loss function: .....................................................................30
CHƯƠNG 4. THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ..................................31
4.1 Công cụ và môi trường thực hiện ........................................................................31
4.2 Dữ liệu chuẩn bị (dataset) .....................................................................................31
4.3 Tăng cường dữ liệu bằng data augmentation .....................................................33
4.4 Mơ hình train trong phần mềm: ..........................................................................37
4.5 Training ..................................................................................................................38
4.6 Xuất kết quả training ............................................................................................ 39
4.7 Kết quả thực nghiệm ............................................................................................. 40
4.8 So sánh độ chính xác mơ hình với mơ hình nghiên cứu khác ...........................44
II
4.9. So sánh kết quả với cùng mơ hình với cơng trình nghiên cứu khác: ...............45
CHƯƠNG 5: KẾT LUẬN VÀ KIẾN NGHỊ ............................................................. 47
5.1 Kết luận chung .......................................................................................................47
5.1.1 Ưu điểm:.......................................................................................................47
5.1.2 Nhược điểm: ................................................................................................ 47
5.2 Kiến nghị ................................................................................................................47
TÀI LIỆU THAM KHẢO
LINK ĐẶT MUA TÀI LIỆU ONLINE
LINK ĐẶT MUA TÀI LIỆU ONLINE 1
LINK DOWNLOAD (UPDATING...)

%20(1).png)

.png)
Không có nhận xét nào: