NHẬN DẠNG CHỮ VIẾT TAY TIẾNG VIỆT SỬ DỤNG MẠNG NEURON TÍCH CHẬP
Deep Learning là một thuật toán dựa trên một số ý tưởng từ não bộ tới việc tiếp thu nhiều tầng biểu đạt, cả cụ thể lẫn trừu tượng, qua đó làm rõ ý nghĩa của các từ loại dữ liệu. Deep Learning được ứng dụng trong nhận diện ảnh, nhận diện giọng nói, xử lý ngôn ngữ tự nhiên.
Hiện nay rất nhiều các bài toán nhận dạng sử dụng deep learning để giải quyết do deep learning có thể giải quyết các bài toán với số lượng lớn, kích thước đầu vào lớn với hiệu năng cũng như độ chính xác vượt trội so với các phương pháp phân lớp truyền thống.
Convolution Neural Network (CNNs – Mạng nơ-ron tích chập) là một trong những mô hình Deep Learning tiên tiến giúp cho chúng ta xây dựng được những hệ thống thông minh với độ chính xác cao như hiện nay. Trong bài tiểu luận này, em đi vào nghiên cứu về mạng neural cũng như mạng Convolution của mô hình CNNs trong phân lớp ảnh, và áp dụng trong việc xây dựng hệ thống nhận dạng chữ viết tay tiếng Việt.
Trong bài tiểu luận này em sẽ xây dựng mô hình mạng nơ-ron tích chập với việc sử dụng nhiều lớp khác nhau của mạng để trích chọn tự động được các đặc trưng tốt nhất trong ảnh. Đồng thời, cũng kết hợp giữa mạng nơ-ron tích chập và Multi-layer Perceptron nhằm cải thiện hiệu suất của mô hình.
Nhận dạng chữ viết tay là bài toán được quan tâm rất nhiều vì nó là một trong các yêu cầu trong nhiều ứng dụng thực tế. Các ứng dụng của nhận dạng chữ viết tay đã và đang được ứng dụng vào đời sống như phục vụ cho công việc tựu động hóa đọc tài liệu, tăng tốc độ và hiệu quả nhập thông tin vào máy tính. Nhận dạng chữ viết tay có thể phục vụ cho các ứng dụng đọc và xử lý các chứng từ, hóa đơn, phiếu ghi, bản viết tay chương trình, ….
Hiện nay, đã có một số đề tài nghiên cứu nhận dạng chữ viết tay sử dụng các mô hình như: K láng giềng gần nhất (K-Nearest Neighbor - KNN), máy hỗ trợ vec-tơ (Suport Vector Machine - SVM), mô hình Markov ẩn (Hidden Markov Model-HMM)….. Tuy nhiên, các mô hình này cho kết quả nhận dạng không cao, mất nhiều thời gian cho việc trích rút đặc trưng ảnh. Vì vậy, trong nghiên cứu này chúng tôi sẽ xây dựng một mô hình mới để có thể trích rút tự động các đặc trưng trong ảnh và mô hình mới này cũng cho kết quả tốt hơn các mô hình trước đó.
NỘI DUNG:
PHẦN MỞ ĐẦU
Chương I. TỔNG QUAN TÀI LIỆU
1.1 . Giới thiệu.
1.1.1 . Tổng quan về nhận diện ký tự quang học
1.2 . Phạm vi nghiên cứu.
1.3 . Khái quát về xử lý ảnh.
1.3.1 . Một số khái niệm cơ bản
1.3.2 . Một số vấn đề trong xử lý ảnh ký tự
1.3.2.1 . Các hệ thống xử lý ảnh
1.3.2.2 . Các hình thái của ảnh
1.3.2.3 . Một số ứng dụng trong xử lý ảnh
1.4 . Hệ thống nhận diện ký tự viết tay.
1.4.1 . Những khó khan của bài toán
1.4.2 . Tầm quan trọng và ứng dụng của bài toán nhận dạng chữ viết tay
1.4.3 . Các thành phần của hệ thống
Chương II. CƠ SƠ LÝ THUYẾT VÀ MÔ HÌNH NGHIÊN CỨU.
2.1 . Hệ thống phát hiện ký tự.
2.1.1 . Tiền xử lý
2.1.1.1 . Nhị phân hóa
2.1.1.2 . Phân ngưỡng ảnh với thuật toán Otsu
2.1.1.3 . Lọc ảnh
2.1.1.4 . Làm trơn biên chữ
2.1.1.5 . Làm mảnh chữ
2.1.1.6 . Làm đầy chữ
2.1.2 . Phát hiện ký tự, phát hiện biên canny
2.2 . Hệ thống nhận diện ký tự.
2.2.1 . Mạng nơ-ron và mạng nơ-ron lan truyền ngược
2.2.1.1 . Giới thiệu về mạng nơ-ron.
2.2.1.2 . Một số kiểu mạng nơ-ron.
2.2.1.3 . Mạng nơ-ron truyền thẳng nhiều lớp MP
2.2.2 . Mạng nơ-ron tích chập.
2.2.2.1 . Định nghĩa mạng nơ-ron tích chập
2.2.2.2 . Tích chập (Convolution)
2.2.2.3 . Mô hình mạng nơ-ron tích chập
Chương III. THIẾT KẾ, MÔ PHỎNG
3.1.1 . Thu thập dữ liệu
3.1.2 . Huấn luyện dữ liệu
3.1.2.1 . Mô hình sử dụng
3.2.2.2 . Công cụ huấn luyện và phần cứng huấn luyện
3.2.2.3 . Các tiêu chi đánh giá và huấn luyện
KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU TIẾP THEO
Deep Learning là một thuật toán dựa trên một số ý tưởng từ não bộ tới việc tiếp thu nhiều tầng biểu đạt, cả cụ thể lẫn trừu tượng, qua đó làm rõ ý nghĩa của các từ loại dữ liệu. Deep Learning được ứng dụng trong nhận diện ảnh, nhận diện giọng nói, xử lý ngôn ngữ tự nhiên.
Hiện nay rất nhiều các bài toán nhận dạng sử dụng deep learning để giải quyết do deep learning có thể giải quyết các bài toán với số lượng lớn, kích thước đầu vào lớn với hiệu năng cũng như độ chính xác vượt trội so với các phương pháp phân lớp truyền thống.
Convolution Neural Network (CNNs – Mạng nơ-ron tích chập) là một trong những mô hình Deep Learning tiên tiến giúp cho chúng ta xây dựng được những hệ thống thông minh với độ chính xác cao như hiện nay. Trong bài tiểu luận này, em đi vào nghiên cứu về mạng neural cũng như mạng Convolution của mô hình CNNs trong phân lớp ảnh, và áp dụng trong việc xây dựng hệ thống nhận dạng chữ viết tay tiếng Việt.
Trong bài tiểu luận này em sẽ xây dựng mô hình mạng nơ-ron tích chập với việc sử dụng nhiều lớp khác nhau của mạng để trích chọn tự động được các đặc trưng tốt nhất trong ảnh. Đồng thời, cũng kết hợp giữa mạng nơ-ron tích chập và Multi-layer Perceptron nhằm cải thiện hiệu suất của mô hình.
Nhận dạng chữ viết tay là bài toán được quan tâm rất nhiều vì nó là một trong các yêu cầu trong nhiều ứng dụng thực tế. Các ứng dụng của nhận dạng chữ viết tay đã và đang được ứng dụng vào đời sống như phục vụ cho công việc tựu động hóa đọc tài liệu, tăng tốc độ và hiệu quả nhập thông tin vào máy tính. Nhận dạng chữ viết tay có thể phục vụ cho các ứng dụng đọc và xử lý các chứng từ, hóa đơn, phiếu ghi, bản viết tay chương trình, ….
Hiện nay, đã có một số đề tài nghiên cứu nhận dạng chữ viết tay sử dụng các mô hình như: K láng giềng gần nhất (K-Nearest Neighbor - KNN), máy hỗ trợ vec-tơ (Suport Vector Machine - SVM), mô hình Markov ẩn (Hidden Markov Model-HMM)….. Tuy nhiên, các mô hình này cho kết quả nhận dạng không cao, mất nhiều thời gian cho việc trích rút đặc trưng ảnh. Vì vậy, trong nghiên cứu này chúng tôi sẽ xây dựng một mô hình mới để có thể trích rút tự động các đặc trưng trong ảnh và mô hình mới này cũng cho kết quả tốt hơn các mô hình trước đó.
NỘI DUNG:
PHẦN MỞ ĐẦU
Chương I. TỔNG QUAN TÀI LIỆU
1.1 . Giới thiệu.
1.1.1 . Tổng quan về nhận diện ký tự quang học
1.2 . Phạm vi nghiên cứu.
1.3 . Khái quát về xử lý ảnh.
1.3.1 . Một số khái niệm cơ bản
1.3.2 . Một số vấn đề trong xử lý ảnh ký tự
1.3.2.1 . Các hệ thống xử lý ảnh
1.3.2.2 . Các hình thái của ảnh
1.3.2.3 . Một số ứng dụng trong xử lý ảnh
1.4 . Hệ thống nhận diện ký tự viết tay.
1.4.1 . Những khó khan của bài toán
1.4.2 . Tầm quan trọng và ứng dụng của bài toán nhận dạng chữ viết tay
1.4.3 . Các thành phần của hệ thống
Chương II. CƠ SƠ LÝ THUYẾT VÀ MÔ HÌNH NGHIÊN CỨU.
2.1 . Hệ thống phát hiện ký tự.
2.1.1 . Tiền xử lý
2.1.1.1 . Nhị phân hóa
2.1.1.2 . Phân ngưỡng ảnh với thuật toán Otsu
2.1.1.3 . Lọc ảnh
2.1.1.4 . Làm trơn biên chữ
2.1.1.5 . Làm mảnh chữ
2.1.1.6 . Làm đầy chữ
2.1.2 . Phát hiện ký tự, phát hiện biên canny
2.2 . Hệ thống nhận diện ký tự.
2.2.1 . Mạng nơ-ron và mạng nơ-ron lan truyền ngược
2.2.1.1 . Giới thiệu về mạng nơ-ron.
2.2.1.2 . Một số kiểu mạng nơ-ron.
2.2.1.3 . Mạng nơ-ron truyền thẳng nhiều lớp MP
2.2.2 . Mạng nơ-ron tích chập.
2.2.2.1 . Định nghĩa mạng nơ-ron tích chập
2.2.2.2 . Tích chập (Convolution)
2.2.2.3 . Mô hình mạng nơ-ron tích chập
Chương III. THIẾT KẾ, MÔ PHỎNG
3.1.1 . Thu thập dữ liệu
3.1.2 . Huấn luyện dữ liệu
3.1.2.1 . Mô hình sử dụng
3.2.2.2 . Công cụ huấn luyện và phần cứng huấn luyện
3.2.2.3 . Các tiêu chi đánh giá và huấn luyện
KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU TIẾP THEO

%20(1).png)

.png)
Không có nhận xét nào: