Nhận dạng chữ số viết tay sử dụng kỹ thuật học sâu (deep learning)



TÓM TẮT


Vấn đề nhận dạng chữ viết tay nói chung và nhận dạng chữ số viết tay nói riêng là một thách thức lớn đối với các nhà nghiên cứu. Bài toán lớn luôn đặt ra phía trước vì sự phức tạp của việc nhận dạng chữ viết phụ thuộc nhiều vào phong cách viết và cách thể hiện ngôn ngữ của người viết.

Nhận dạng ký tự viết tay là một lĩnh vực được quan tâm nghiên cứu và được ứng dụng rộng rãi trong nhiều lĩnh vực như: nhận dạng các chữ số trên phiếu chi ngân hàng, mã số trên bì thư của dịch vụ bưu chính, …

Luận văn đã tập trung nghiên cứu các vấn đề như sau:

- Xử lý và phân tích được được các ký tự ảnh đầu vào.

- Chuyển đổi ký tự sang ma trận điểm ảnh và ma trận Kernel.

- Tiến hành nhận dạng ký tự bằng thuật toán mạng neural tích chập.


Từ khóa : Nhận dạng, học sâu, chữ số viết tay, mạng nơ ron, tích chập.

ABSTRACT The problems of recognizing the handwritten digits and characters cause a big issue to challenge the studying and the scientists. The hard situations and huge questions always occur in the processing of the program because it is so complicated to regconize the hand writing. It depends on the styles of the people who is writing and language expression of the writer.

Recognizing the handwritten characters and digits is one of the most important fields which is researched and applied in our lives in so many ways. Such as recognizing the characters or number on the receipt papers of the banks, the pin numbers on the envelopes of the post offices,...

The thesis focuses on the following issues:

- Handling and analyzes the input image character.

- Convert characters into pixel matrix and matrix Kernel.

- Conduct a character recognition algorithm using neural network convolution.

Key words : recognition, deep learning, handwriting, neural network, convolution.


NỘI DUNG:


1. Tính cấp thiết của đề tài ........................................................................................1
2. Mục tiêu nghiên cứu ............................................................................................. 1
3. Đối tượng và phạm vi nghiên cứu ........................................................................1
4. Phương pháp nghiên cứu ......................................................................................2
5. Ý nghĩa của đề tài .................................................................................................2
6. Bố cục luận văn .....................................................................................................2
CHƢƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG CHỮ SỐ
VIẾT TAY ......................................................................................................................3
1.1. Tổng quan về nhận dạng chữ số viết tay ..................................................................3
1.1.1. Giới thiệu chung.............................................................................................. 3
1.1.2. Những khó khăn trong việc nhận dạng chữ số viết tay ..................................3
1.1.3. Các công trình nghiên cứu trong và ngoài nước. ............................................4
1.1.4. Các bước trong quá trình xử lý ảnh ................................................................ 5
1.1.5. Một số khái niệm trong xử lý ảnh ...................................................................7
1.2. Các phương pháp xử lý ảnh ......................................................................................8
1.2.1. Lọc mịn ảnh ....................................................................................................8
1.2.2. Nhị phân ảnh ...................................................................................................8
1.2.3. Chỉnh nghiêng .................................................................................................8
1.2.4. Chuẩn kích thước ............................................................................................ 9
1.2.5. Lấp khoảng trống ảnh .....................................................................................9
1.2.6. Phát hiện biên và làm trơn biên ....................................................................11
1.2.7. Xác định hướng của điểm biên (Freeman code) ...........................................11
1.2.8. Làm trơn đường biên ....................................................................................12
1.3. Các phương pháp nhận dạng chữ số viết tay .......................................................... 14
1.3.1. Phương pháp đối sánh mẫu ...........................................................................14
1.3.2. Phương pháp tiếp cận cấu trúc ......................................................................14
1.3.3. Phương pháp học máy với SVM (Support vector machine) .........................15
CHƢƠNG 2. MÔ HÌNH MẠNG NEURAL TÍCH CHẬP ......................................16
2.1. Mạng neural nhân tạo ............................................................................................. 16
2.1.1. Sơ lược về neural sinh học ............................................................................16
2.1.2. Mạng Neural nhân tạo ...................................................................................17
2.1.3. Kiến trúc mạng .............................................................................................. 19
2.1.4. Mạng một tầng .............................................................................................. 19

2.1.5. Mạng đa tầng.................................................................................................20
2.1.6. Huấn luyện mạng neural ...............................................................................21
2.2. Mạng Neural tích chập (Convolutional Neural Networks – CNNs) ......................24
2.2.1. Convolution (tích chập) ................................................................................24
2.2.2. Khái niệm CNNs ........................................................................................... 25
2.2.3. Cấu trúc mạng neural tích chập ....................................................................27
2.2.4. Những phương pháp tích chập (convolution) ...............................................28
2.2.5. Một số phép tích chập thường sử dụng trong xử lý ảnh ............................... 32
CHƢƠNG 3. NHẬN DẠNG CHỮ SỐ VIẾT TAY VỚI MẠNG NƠ RON
TÍCH CHẬP .................................................................................................................35
3.1. Bài toán nhận dạng .................................................................................................35
3.1.1. Phát biểu bài toán .......................................................................................... 35
3.1.2. Ảnh đầu vào của bài toán ..............................................................................35
3.2. Mô hình tổng quan ..................................................................................................36
3.3. Xây dựng mạng Neural nhận dạng ký tự................................................................ 37
3.3.1. Xây dựng mạng neural ..................................................................................37
3.3.2. Xử lý dữ liệu (phân tích ảnh) ........................................................................37
3.4. Xây dựng chương trình thử nghiệm .......................................................................43
3.4.1. Giới thiệu Python .......................................................................................... 43
3.4.2. Giới thiệu Tensorflow và cách cài đặt .......................................................... 44
3.4.3. Xây dựng mô hình mạng tích chập ............................................................... 44
3.4.4. Đầu vào và nhãn............................................................................................ 47
3.4.5. Lớp Convolution với hàm kích hoạt relu ......................................................48
3.4.6. Lớp Pooling...................................................................................................48
3.4.7. Lớp FC ..........................................................................................................49
3.4.8. Mô hình đầy đủ ............................................................................................. 50
3.4.9. Huấn luyện và kiểm chứng mô hình ............................................................. 51
3.5. Kết quả thử nghiệm ................................................................................................ 52
KẾT LUẬN ..................................................................................................................53
TÀI LIỆU THAM KHẢO........................................................................................... 55


LINK DOWNLOAD



TÓM TẮT


Vấn đề nhận dạng chữ viết tay nói chung và nhận dạng chữ số viết tay nói riêng là một thách thức lớn đối với các nhà nghiên cứu. Bài toán lớn luôn đặt ra phía trước vì sự phức tạp của việc nhận dạng chữ viết phụ thuộc nhiều vào phong cách viết và cách thể hiện ngôn ngữ của người viết.

Nhận dạng ký tự viết tay là một lĩnh vực được quan tâm nghiên cứu và được ứng dụng rộng rãi trong nhiều lĩnh vực như: nhận dạng các chữ số trên phiếu chi ngân hàng, mã số trên bì thư của dịch vụ bưu chính, …

Luận văn đã tập trung nghiên cứu các vấn đề như sau:

- Xử lý và phân tích được được các ký tự ảnh đầu vào.

- Chuyển đổi ký tự sang ma trận điểm ảnh và ma trận Kernel.

- Tiến hành nhận dạng ký tự bằng thuật toán mạng neural tích chập.


Từ khóa : Nhận dạng, học sâu, chữ số viết tay, mạng nơ ron, tích chập.

ABSTRACT The problems of recognizing the handwritten digits and characters cause a big issue to challenge the studying and the scientists. The hard situations and huge questions always occur in the processing of the program because it is so complicated to regconize the hand writing. It depends on the styles of the people who is writing and language expression of the writer.

Recognizing the handwritten characters and digits is one of the most important fields which is researched and applied in our lives in so many ways. Such as recognizing the characters or number on the receipt papers of the banks, the pin numbers on the envelopes of the post offices,...

The thesis focuses on the following issues:

- Handling and analyzes the input image character.

- Convert characters into pixel matrix and matrix Kernel.

- Conduct a character recognition algorithm using neural network convolution.

Key words : recognition, deep learning, handwriting, neural network, convolution.


NỘI DUNG:


1. Tính cấp thiết của đề tài ........................................................................................1
2. Mục tiêu nghiên cứu ............................................................................................. 1
3. Đối tượng và phạm vi nghiên cứu ........................................................................1
4. Phương pháp nghiên cứu ......................................................................................2
5. Ý nghĩa của đề tài .................................................................................................2
6. Bố cục luận văn .....................................................................................................2
CHƢƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG CHỮ SỐ
VIẾT TAY ......................................................................................................................3
1.1. Tổng quan về nhận dạng chữ số viết tay ..................................................................3
1.1.1. Giới thiệu chung.............................................................................................. 3
1.1.2. Những khó khăn trong việc nhận dạng chữ số viết tay ..................................3
1.1.3. Các công trình nghiên cứu trong và ngoài nước. ............................................4
1.1.4. Các bước trong quá trình xử lý ảnh ................................................................ 5
1.1.5. Một số khái niệm trong xử lý ảnh ...................................................................7
1.2. Các phương pháp xử lý ảnh ......................................................................................8
1.2.1. Lọc mịn ảnh ....................................................................................................8
1.2.2. Nhị phân ảnh ...................................................................................................8
1.2.3. Chỉnh nghiêng .................................................................................................8
1.2.4. Chuẩn kích thước ............................................................................................ 9
1.2.5. Lấp khoảng trống ảnh .....................................................................................9
1.2.6. Phát hiện biên và làm trơn biên ....................................................................11
1.2.7. Xác định hướng của điểm biên (Freeman code) ...........................................11
1.2.8. Làm trơn đường biên ....................................................................................12
1.3. Các phương pháp nhận dạng chữ số viết tay .......................................................... 14
1.3.1. Phương pháp đối sánh mẫu ...........................................................................14
1.3.2. Phương pháp tiếp cận cấu trúc ......................................................................14
1.3.3. Phương pháp học máy với SVM (Support vector machine) .........................15
CHƢƠNG 2. MÔ HÌNH MẠNG NEURAL TÍCH CHẬP ......................................16
2.1. Mạng neural nhân tạo ............................................................................................. 16
2.1.1. Sơ lược về neural sinh học ............................................................................16
2.1.2. Mạng Neural nhân tạo ...................................................................................17
2.1.3. Kiến trúc mạng .............................................................................................. 19
2.1.4. Mạng một tầng .............................................................................................. 19

2.1.5. Mạng đa tầng.................................................................................................20
2.1.6. Huấn luyện mạng neural ...............................................................................21
2.2. Mạng Neural tích chập (Convolutional Neural Networks – CNNs) ......................24
2.2.1. Convolution (tích chập) ................................................................................24
2.2.2. Khái niệm CNNs ........................................................................................... 25
2.2.3. Cấu trúc mạng neural tích chập ....................................................................27
2.2.4. Những phương pháp tích chập (convolution) ...............................................28
2.2.5. Một số phép tích chập thường sử dụng trong xử lý ảnh ............................... 32
CHƢƠNG 3. NHẬN DẠNG CHỮ SỐ VIẾT TAY VỚI MẠNG NƠ RON
TÍCH CHẬP .................................................................................................................35
3.1. Bài toán nhận dạng .................................................................................................35
3.1.1. Phát biểu bài toán .......................................................................................... 35
3.1.2. Ảnh đầu vào của bài toán ..............................................................................35
3.2. Mô hình tổng quan ..................................................................................................36
3.3. Xây dựng mạng Neural nhận dạng ký tự................................................................ 37
3.3.1. Xây dựng mạng neural ..................................................................................37
3.3.2. Xử lý dữ liệu (phân tích ảnh) ........................................................................37
3.4. Xây dựng chương trình thử nghiệm .......................................................................43
3.4.1. Giới thiệu Python .......................................................................................... 43
3.4.2. Giới thiệu Tensorflow và cách cài đặt .......................................................... 44
3.4.3. Xây dựng mô hình mạng tích chập ............................................................... 44
3.4.4. Đầu vào và nhãn............................................................................................ 47
3.4.5. Lớp Convolution với hàm kích hoạt relu ......................................................48
3.4.6. Lớp Pooling...................................................................................................48
3.4.7. Lớp FC ..........................................................................................................49
3.4.8. Mô hình đầy đủ ............................................................................................. 50
3.4.9. Huấn luyện và kiểm chứng mô hình ............................................................. 51
3.5. Kết quả thử nghiệm ................................................................................................ 52
KẾT LUẬN ..................................................................................................................53
TÀI LIỆU THAM KHẢO........................................................................................... 55


LINK DOWNLOAD

M_tả
M_tả

Không có nhận xét nào: