SÁCH - Giáo trình Thị giác máy tính và ứng dụng (Lê Mỹ Hà)
SÁCH - Giáo trình Thị giác máy tính và ứng dụng (Lê Mỹ Hà)
NỘI DUNG:
Chương 1: XỬ LÝ ẢNH CƠ BẢN VÀ NGÔN NGỮ LẬP TRÌNH
PYTHON ........................................................................... 13
1.1. PIL - THƯ VIỆN HÌNH ẢNH TRONG PYTHON ................... 13
1.1.1. Chuyển đổi hình ảnh sang định dạng khác ............................ 14
1.1.2. Tạo hình thu nhỏ .................................................................... 15
1.1.3. Sao chép và dán các vùng ...................................................... 15
1.1.4. Thay đổi kích thước và xoay ................................................. 15
1.2. MATPLOTLIB ........................................................................... 15
1.2.1. Vẽ hình ảnh, điểm và đường ................................................. 16
1.2.2. Đường biên ảnh và lược đồ ................................................... 17
1.2.3. Chú thích tương tác ............................................................... 19
1.3. NUMPY ..................................................................................... 19
1.3.1. Thể hiện hình ảnh dưới dạng mảng ....................................... 20
1.3.2. Biến đổi cấp độ xám .............................................................. 21
1.3.3. Cân bằng lược đồ ảnh ............................................................ 23
1.3.4. Phép tính trung bình pixel ảnh .............................................. 25
1.3.5. Phân tích thành phần chính (PCA) của hình ảnh ................... 26
1.3.6. Sử dụng Module Pickle ......................................................... 29
1.4. SCIPY......................................................................................... 30
1.4.1. Làm mờ ảnh ........................................................................... 30
1.4.2. Tính đạo hàm của ảnh (Image derivatives) ........................... 32
1.4.3. Các module SciPy hữu ích khác ............................................ 36
1.5. VÍ DỤ NÂNG CAO: GIẢM NHIỄU HÌNH ẢNH .................... 37
1.6. BÀI TẬP .................................................................................... 41
Chương 2: MÔ TẢ ĐẶC TRƯNG HÌNH ẢNH ................................ 42
2.1. XÁC ĐỊNH ĐẶC TRƯNG GÓC HARRIS ............................... 42
2.2. ĐẶC TRƯNG BẤT BIẾN VỚI SỰ THAY ĐỔI TỶ LỆ ẢNH
(SCALE-INVARIANT FEATURE TRANSFORM- SIFT) ....... 49
2.2.1. Lập trình xác định đặc trưng SIFT trong ảnh ........................ 53
2.2.2. Đối sánh các mô tả của điểm đặc trưng ................................. 54
2.3. BÀI TẬP .................................................................................... 60
4
Chương 3: PHÉP ÁNH XẠ HÌNH ẢNH............................................ 61
3.1. HOMOGRAPHIES .................................................................... 63
3.1.1. Thuật toán biến đổi tuyến tính trực tiếp ................................ 64
3.1.2. Biến đổi Affine ...................................................................... 69
3.2. Nắn ảnh ...................................................................................... 66
3.2.1. Đặt một ảnh trong một ảnh khác ........................................... 67
3.2.2. Nắn ảnh Affine theo từng cặp ................................................ 70
3.2.3. Hiển thị hình ảnh ................................................................... 74
3.3. Tạo ảnh toàn cảnh ...................................................................... 79
3.3.1. Thuật toán RANSAC ............................................................. 79
3.3.2. Ước tính hệ tọa độ đồng nhất bền vững ................................ 81
3.3.3. Ghép các hình ảnh lại với nhau ............................................. 85
3.4. BÀI TẬP .................................................................................... 88
Chương 4: MÔ HÌNH MÁY ẢNH VÀ THỰC TẾ ẢO ..................... 89
4.1. MÔ HÌNH MÁY ẢNH LỖ KIM (PIN- HOLE CAMERA) ...... 89
4.1.1. Điểm chiếu 3D ....................................................................... 91
4.1.2. Hệ số ma trận camera ............................................................ 93
4.1.3. Tính toán điểm trung tâm camera .......................................... 94
4.2. HIỆU CHỈNH MÁY ẢNH ......................................................... 94
4.3. ƯỚC LƯỢNG VỊ TRÍ CAMERA TỪ MẶT PHẲNG
VÀ ĐIỂM MỐC ......................................................................... 96
4.4. THỰC TẾ ẢO .......................................................................... 100
4.4.1. PyGame và PyOpenGL ....................................................... 101
4.4.2. Từ ma trận camera đến định dạng OpenGL ........................ 102
4.4.3. Đặt các đối tượng ảo trong ảnh ........................................... 104
4.4.4. Kết nối tất cả ảnh ................................................................. 105
4.4.5. Tải mô hình ......................................................................... 107
4.5. BÀI TẬP .................................................................................. 109
Chương 5: HÌNH HỌC ĐA GÓC NHÌN (MULTIPLE VIEW
GEOMETRY) .................................................................. 110
5.1. EPIPOLAR GEOMETRY ........................................................ 110
5.1.1. Một tập dữ liệu mẫu ............................................................ 112
5.1.2. Vẽ dữ liệu 3D với Matplotlib .............................................. 114
5.1.3. Epipole và các đường thẳng epipole.................................... 117
5
5.2. TÍNH TOÁN VỚI MÁY ẢNH VÀ CẤU TRÚC 3D ............... 119
5.2.1. Tính toán ma trận camera từ các điểm 3D .......................... 121
5.2.2. Tính toán ma trận camera từ ma trận cơ bản ....................... 123
5.2.3. Trường hợp không được hiệu chỉnh - tái cấu trúc hình chiếu .. 123
5.2.4. Trường hợp được hiệu chỉnh - tái cấu trúc chính xác mô hình . 124
5.3. TÁI CẤU TRÚC NHIỀU GÓC NHÌN .................................... 125
5.3.1. Ước lượng ma trận cơ bản bền vững ................................... 125
5.3.2. Ví dụ tái tạo 3D ................................................................... 128
5.3.3. Phần mở rộng và nhiều hơn hai góc nhìn ............................ 131
5.4. ẢNH STEREO ......................................................................... 132
5.5. BÀI TẬP .................................................................................. 138
Chương 6: PHÂN CỤM ẢNH .......................................................... 139
6.1. THUẬT TOÁN PHÂN CỤM K-MEANS ............................... 139
6.1.1. Thư viện phân cụm SciPy.................................................... 140
6.1.2. Phân cụm ảnh ...................................................................... 141
6.1.3. Biểu diễn trực quan ảnh các thành phần chính .................... 143
6.1.4. Phân cụm các Pixels ............................................................ 154
6.2. PHÂN CỤM THEO THỨ BẬC............................................... 146
6.3. Phân cụm ảnh ........................................................................... 150
6.4. PHÂN CỤM PHỔ .................................................................... 155
6.5. BÀI TẬP .................................................................................. 159
Chương 7: TÌM KIẾM ẢNH ............................................................ 160
7.1. TRUY XUẤT ẢNH DỰA TRÊN NỘI DUNG ........................ 160
7.2. TỪ NGỮ TRỰC QUAN (VISUAL WORDS) ........................ 161
7.3. LẬP CHỈ MỤC ẢNH ............................................................... 165
7.3.1. Thiết lập cơ sở dữ liệu ......................................................... 165
7.3.2. Thêm ảnh ............................................................................. 166
7.4. TÌM KIẾM CƠ SỞ DỮ LIỆU CHO ẢNH .............................. 168
7.4.1. Tìm kiếm bằng ảnh .............................................................. 170
7.4.2. Kiểm chuẩn và biểu diễn kết quả ........................................ 171
7.5. XẾP HẠNG KẾT QUẢ BẰNG HÌNH HỌC ........................... 173
7.6. XÂY DỰNG CÁC DEMO VÀ ỨNG DỤNG WEB ............... 176
7.7. BÀI TẬP .................................................................................. 179
6
Chương 8: PHÂN LOẠI NỘI DUNG HÌNH ẢNH ......................... 181
8.1. K-NEAREST NEIGHBORS .................................................... 181
8.1.1. Một ví dụ 2D đơn giản ........................................................ 182
8.1.2. Đặc trưng hình ảnh dùng dense SIFT (SIFT dày đặc) ......... 185
8.1.3. Phân loại hình ảnh - nhận dạng cử chỉ tay........................... 187
8.2. BỘ PHÂN LOẠI BAYES ........................................................ 190
8.3. SUPPORT VECTOR MACHINES .......................................... 195
8.3.1. Sử dụng LibSVM ................................................................ 196
8.3.2. Nhận dạng cử chỉ tay lại bằng phương pháp SVM ............. 198
8.4. NHẬN DẠNG KÝ TỰ QUANG HỌC (OPTICAL
CHARACTER RECOGNITION) ............................................ 200
8.4.1. Huấn luyện một bộ phân loại .............................................. 200
8.4.2. Chọn đặc trưng .................................................................... 201
8.4.3. SVM nhiều lớp .................................................................... 201
8.4.4. Trích xuất các hàng và nhận dạng ký tự .............................. 202
8.4.5. Chỉnh sửa hình ảnh .............................................................. 205
8.5. BÀI TẬP .................................................................................. 206
Chương 9: PHÂN ĐOẠN ẢNH ........................................................ 208
9.1. PHƯƠNG PHÁP CẮT ĐỒ THỊ (GRAPH CUTS) .................. 208
9.1.1. Đồ thị từ các hình ảnh ......................................................... 210
9.1.2. Phân đoạn với đầu vào của người dùng............................... 215
9.2. PHÂN ĐOẠN BẰNG CÁCH SỬ DỤNG PHÂN CỤM ......... 217
9.3. PHƯƠNG PHÁP BIẾN PHÂN................................................ 222
9.4. BÀI TẬP .................................................................................. 224
Chương 10: GIỚI THIỆU THƯ VIỆN OpenCV ............................ 226
10.1. GIAO DIỆN PYTHON OPENCV ........................................ 226
10.2. KHÁI NIỆM CƠ BẢN VỀ OPENCV .................................. 226
10.2.1. Đọc và viết hình ảnh .......................................................... 227
10.2.2. Không gian màu ................................................................. 227
10.2.3. Hiển thị hình ảnh và kết quả .............................................. 228
10.3. XỬ LÝ VIDEO ..................................................................... 231
10.3.1. Đầu vào video .................................................................... 231
10.3.2. Đọc video vào mảng NumPy ............................................. 233
10.4. THEO VẾT (TRACKING) ................................................... 233
7
10.4.1. Luồng quang học ............................................................... 233
10.4.2. Thuật toán Lucas-Kanade .................................................. 236
10.4.3. Sử dụng generators ............................................................ 241
10.5. CÁC VÍ DỤ KHÁC ................................................................ 242
10.5.1. Vá lỗi ảnh (Inpainting) ...................................................... 243
10.5.2. Phát hiện đường thẳng với phép biến đổi Hough .............. 244
10.6. BÀI TẬP ................................................................................ 245
Chương 11: ỨNG DỤNG HÌNH HỌC ĐA GÓC NHÌN VÀO XÂY
DỰNG MÔ HÌNH 3D KẾT HỢP PHÂN TÍCH NGỮ
NGHĨA VÀ PHƯƠNG PHÁP TỐI ƯU LỒI .............. 247
11.1. GIỚI THIỆU.......................................................................... 247
11.2. MÔ TẢ THUẬT TOÁN ........................................................ 248
11.2.1. Phân tích ngữ nghĩa ........................................................... 249
11.2.2. Xây dựng lại cảnh quan trong trường hợp đặc biệt ........... 253
11.2.3. Đối sánh theo phương pháp cặp ảnh stereo ....................... 259
11.3. THỰC NGHIỆM TRÊN TẬP DỮ LIỆU THỰC .................. 260
11.4. KẾT LUẬN ........................................................................... 263
Chương 12: ỨNG DỤNG HÌNH HỌC ĐA GÓC NHÌN TRONG
ĐỊNH VỊ CHO MÁY ẢNH ĐA HƯỚNG ................... 264
12.1. GIỚI THIỆU.......................................................................... 264
12.2. MÔ TẢ THUẬT TOÁN ........................................................ 264
12.2.1. Ước tính các cặp chuyển động xoay .................................. 265
12.2.2. Biến đổi camera đa hướng trong mô hình cầu ................... 266
12.2.3. Trích đặc trưng đường ....................................................... 267
12.2.4. Phát hiện điểm vô cực dựa trên phương pháp RANSAC ...... 270
12.2.5. Tìm các điểm vô cực tương đồng dựa trên phương pháp ước
lượng chuyển động xoay ..................................................... 271
12.3. TÍNH TOÁN GÓC XOAY TOÀN CỤC CỦA CAMERA .... 273
12.4. SỰ PHỤC HỒI CHUYỂN ĐỘNG CỦA CAMERA ............ 273
12.4.1. Điểm tương đồng trên gương cầu ...................................... 273
12.4.2. Chuyển động của camera với ma trận xoay đã biết ........... 273
12.4.3. Tối ưu hóa trong mô hình hình cầu ................................... 275
12.4.3. Tối ưu gần lồi sử dụng ngưỡng giữa ................................. 277
12.5. THỰC NGHIỆM ................................................................... 278
8
12.6. KẾT LUẬN ........................................................................... 284
Chương 13: ỨNG DỤNG THỊ GIÁC MÁY TÍNH KẾT HỢP
BIẾN GPS TRONG ĐỊNH VỊ ROBOT ...................... 281
13.1. GIỚI THIỆU.......................................................................... 281
13.2. MÔ TẢ THUẬT TOÁN ........................................................ 284
13.3. HỆ THỐNG ĐO LƯỜNG BẰNG THỊ GIÁC DỰA TRÊN
CAMERA ĐA HƯỚNG ........................................................... 286
13.3.1. Phân tích mô hình di chuyển ............................................. 286
13.3.2. Hệ thống đo lường bằng hình ảnh ..................................... 290
13.4. SỰ HIỆU CHỈNH SAI SỐ ĐO VỊ TRÍ CỦA HỆ THỐNG NHỜ
VÀO THÔNG TIN DẪN ĐƯỜNG QUA VỆ TINH (GPS) .... 293
13.4.1. Đánh giá giá trị đo từ hệ thống định vị toàn cầu ............... 293
13.4.2. Hiệu chỉnh vị trí dựa trên hệ thống định vị toàn cầu ......... 295
13.5. KẾT QUẢ THỰC NGHIỆM ................................................ 295
13.6. KẾT LUẬN ........................................................................... 298
Phụ lục A .............................................................................................. 300
Phụ lục B .............................................................................................. 306
TÀI LIỆU THAM KHẢO.
LINK THƯ VIỆN CÁC TRƯỜNG ĐH/CĐ ĐỂ MƯỢN SÁCH/XEM ONLINE
LINK ĐẶT MUA SÁCH ONLINE
SÁCH - Giáo trình Thị giác máy tính và ứng dụng (Lê Mỹ Hà)
NỘI DUNG:
Chương 1: XỬ LÝ ẢNH CƠ BẢN VÀ NGÔN NGỮ LẬP TRÌNH
PYTHON ........................................................................... 13
1.1. PIL - THƯ VIỆN HÌNH ẢNH TRONG PYTHON ................... 13
1.1.1. Chuyển đổi hình ảnh sang định dạng khác ............................ 14
1.1.2. Tạo hình thu nhỏ .................................................................... 15
1.1.3. Sao chép và dán các vùng ...................................................... 15
1.1.4. Thay đổi kích thước và xoay ................................................. 15
1.2. MATPLOTLIB ........................................................................... 15
1.2.1. Vẽ hình ảnh, điểm và đường ................................................. 16
1.2.2. Đường biên ảnh và lược đồ ................................................... 17
1.2.3. Chú thích tương tác ............................................................... 19
1.3. NUMPY ..................................................................................... 19
1.3.1. Thể hiện hình ảnh dưới dạng mảng ....................................... 20
1.3.2. Biến đổi cấp độ xám .............................................................. 21
1.3.3. Cân bằng lược đồ ảnh ............................................................ 23
1.3.4. Phép tính trung bình pixel ảnh .............................................. 25
1.3.5. Phân tích thành phần chính (PCA) của hình ảnh ................... 26
1.3.6. Sử dụng Module Pickle ......................................................... 29
1.4. SCIPY......................................................................................... 30
1.4.1. Làm mờ ảnh ........................................................................... 30
1.4.2. Tính đạo hàm của ảnh (Image derivatives) ........................... 32
1.4.3. Các module SciPy hữu ích khác ............................................ 36
1.5. VÍ DỤ NÂNG CAO: GIẢM NHIỄU HÌNH ẢNH .................... 37
1.6. BÀI TẬP .................................................................................... 41
Chương 2: MÔ TẢ ĐẶC TRƯNG HÌNH ẢNH ................................ 42
2.1. XÁC ĐỊNH ĐẶC TRƯNG GÓC HARRIS ............................... 42
2.2. ĐẶC TRƯNG BẤT BIẾN VỚI SỰ THAY ĐỔI TỶ LỆ ẢNH
(SCALE-INVARIANT FEATURE TRANSFORM- SIFT) ....... 49
2.2.1. Lập trình xác định đặc trưng SIFT trong ảnh ........................ 53
2.2.2. Đối sánh các mô tả của điểm đặc trưng ................................. 54
2.3. BÀI TẬP .................................................................................... 60
4
Chương 3: PHÉP ÁNH XẠ HÌNH ẢNH............................................ 61
3.1. HOMOGRAPHIES .................................................................... 63
3.1.1. Thuật toán biến đổi tuyến tính trực tiếp ................................ 64
3.1.2. Biến đổi Affine ...................................................................... 69
3.2. Nắn ảnh ...................................................................................... 66
3.2.1. Đặt một ảnh trong một ảnh khác ........................................... 67
3.2.2. Nắn ảnh Affine theo từng cặp ................................................ 70
3.2.3. Hiển thị hình ảnh ................................................................... 74
3.3. Tạo ảnh toàn cảnh ...................................................................... 79
3.3.1. Thuật toán RANSAC ............................................................. 79
3.3.2. Ước tính hệ tọa độ đồng nhất bền vững ................................ 81
3.3.3. Ghép các hình ảnh lại với nhau ............................................. 85
3.4. BÀI TẬP .................................................................................... 88
Chương 4: MÔ HÌNH MÁY ẢNH VÀ THỰC TẾ ẢO ..................... 89
4.1. MÔ HÌNH MÁY ẢNH LỖ KIM (PIN- HOLE CAMERA) ...... 89
4.1.1. Điểm chiếu 3D ....................................................................... 91
4.1.2. Hệ số ma trận camera ............................................................ 93
4.1.3. Tính toán điểm trung tâm camera .......................................... 94
4.2. HIỆU CHỈNH MÁY ẢNH ......................................................... 94
4.3. ƯỚC LƯỢNG VỊ TRÍ CAMERA TỪ MẶT PHẲNG
VÀ ĐIỂM MỐC ......................................................................... 96
4.4. THỰC TẾ ẢO .......................................................................... 100
4.4.1. PyGame và PyOpenGL ....................................................... 101
4.4.2. Từ ma trận camera đến định dạng OpenGL ........................ 102
4.4.3. Đặt các đối tượng ảo trong ảnh ........................................... 104
4.4.4. Kết nối tất cả ảnh ................................................................. 105
4.4.5. Tải mô hình ......................................................................... 107
4.5. BÀI TẬP .................................................................................. 109
Chương 5: HÌNH HỌC ĐA GÓC NHÌN (MULTIPLE VIEW
GEOMETRY) .................................................................. 110
5.1. EPIPOLAR GEOMETRY ........................................................ 110
5.1.1. Một tập dữ liệu mẫu ............................................................ 112
5.1.2. Vẽ dữ liệu 3D với Matplotlib .............................................. 114
5.1.3. Epipole và các đường thẳng epipole.................................... 117
5
5.2. TÍNH TOÁN VỚI MÁY ẢNH VÀ CẤU TRÚC 3D ............... 119
5.2.1. Tính toán ma trận camera từ các điểm 3D .......................... 121
5.2.2. Tính toán ma trận camera từ ma trận cơ bản ....................... 123
5.2.3. Trường hợp không được hiệu chỉnh - tái cấu trúc hình chiếu .. 123
5.2.4. Trường hợp được hiệu chỉnh - tái cấu trúc chính xác mô hình . 124
5.3. TÁI CẤU TRÚC NHIỀU GÓC NHÌN .................................... 125
5.3.1. Ước lượng ma trận cơ bản bền vững ................................... 125
5.3.2. Ví dụ tái tạo 3D ................................................................... 128
5.3.3. Phần mở rộng và nhiều hơn hai góc nhìn ............................ 131
5.4. ẢNH STEREO ......................................................................... 132
5.5. BÀI TẬP .................................................................................. 138
Chương 6: PHÂN CỤM ẢNH .......................................................... 139
6.1. THUẬT TOÁN PHÂN CỤM K-MEANS ............................... 139
6.1.1. Thư viện phân cụm SciPy.................................................... 140
6.1.2. Phân cụm ảnh ...................................................................... 141
6.1.3. Biểu diễn trực quan ảnh các thành phần chính .................... 143
6.1.4. Phân cụm các Pixels ............................................................ 154
6.2. PHÂN CỤM THEO THỨ BẬC............................................... 146
6.3. Phân cụm ảnh ........................................................................... 150
6.4. PHÂN CỤM PHỔ .................................................................... 155
6.5. BÀI TẬP .................................................................................. 159
Chương 7: TÌM KIẾM ẢNH ............................................................ 160
7.1. TRUY XUẤT ẢNH DỰA TRÊN NỘI DUNG ........................ 160
7.2. TỪ NGỮ TRỰC QUAN (VISUAL WORDS) ........................ 161
7.3. LẬP CHỈ MỤC ẢNH ............................................................... 165
7.3.1. Thiết lập cơ sở dữ liệu ......................................................... 165
7.3.2. Thêm ảnh ............................................................................. 166
7.4. TÌM KIẾM CƠ SỞ DỮ LIỆU CHO ẢNH .............................. 168
7.4.1. Tìm kiếm bằng ảnh .............................................................. 170
7.4.2. Kiểm chuẩn và biểu diễn kết quả ........................................ 171
7.5. XẾP HẠNG KẾT QUẢ BẰNG HÌNH HỌC ........................... 173
7.6. XÂY DỰNG CÁC DEMO VÀ ỨNG DỤNG WEB ............... 176
7.7. BÀI TẬP .................................................................................. 179
6
Chương 8: PHÂN LOẠI NỘI DUNG HÌNH ẢNH ......................... 181
8.1. K-NEAREST NEIGHBORS .................................................... 181
8.1.1. Một ví dụ 2D đơn giản ........................................................ 182
8.1.2. Đặc trưng hình ảnh dùng dense SIFT (SIFT dày đặc) ......... 185
8.1.3. Phân loại hình ảnh - nhận dạng cử chỉ tay........................... 187
8.2. BỘ PHÂN LOẠI BAYES ........................................................ 190
8.3. SUPPORT VECTOR MACHINES .......................................... 195
8.3.1. Sử dụng LibSVM ................................................................ 196
8.3.2. Nhận dạng cử chỉ tay lại bằng phương pháp SVM ............. 198
8.4. NHẬN DẠNG KÝ TỰ QUANG HỌC (OPTICAL
CHARACTER RECOGNITION) ............................................ 200
8.4.1. Huấn luyện một bộ phân loại .............................................. 200
8.4.2. Chọn đặc trưng .................................................................... 201
8.4.3. SVM nhiều lớp .................................................................... 201
8.4.4. Trích xuất các hàng và nhận dạng ký tự .............................. 202
8.4.5. Chỉnh sửa hình ảnh .............................................................. 205
8.5. BÀI TẬP .................................................................................. 206
Chương 9: PHÂN ĐOẠN ẢNH ........................................................ 208
9.1. PHƯƠNG PHÁP CẮT ĐỒ THỊ (GRAPH CUTS) .................. 208
9.1.1. Đồ thị từ các hình ảnh ......................................................... 210
9.1.2. Phân đoạn với đầu vào của người dùng............................... 215
9.2. PHÂN ĐOẠN BẰNG CÁCH SỬ DỤNG PHÂN CỤM ......... 217
9.3. PHƯƠNG PHÁP BIẾN PHÂN................................................ 222
9.4. BÀI TẬP .................................................................................. 224
Chương 10: GIỚI THIỆU THƯ VIỆN OpenCV ............................ 226
10.1. GIAO DIỆN PYTHON OPENCV ........................................ 226
10.2. KHÁI NIỆM CƠ BẢN VỀ OPENCV .................................. 226
10.2.1. Đọc và viết hình ảnh .......................................................... 227
10.2.2. Không gian màu ................................................................. 227
10.2.3. Hiển thị hình ảnh và kết quả .............................................. 228
10.3. XỬ LÝ VIDEO ..................................................................... 231
10.3.1. Đầu vào video .................................................................... 231
10.3.2. Đọc video vào mảng NumPy ............................................. 233
10.4. THEO VẾT (TRACKING) ................................................... 233
7
10.4.1. Luồng quang học ............................................................... 233
10.4.2. Thuật toán Lucas-Kanade .................................................. 236
10.4.3. Sử dụng generators ............................................................ 241
10.5. CÁC VÍ DỤ KHÁC ................................................................ 242
10.5.1. Vá lỗi ảnh (Inpainting) ...................................................... 243
10.5.2. Phát hiện đường thẳng với phép biến đổi Hough .............. 244
10.6. BÀI TẬP ................................................................................ 245
Chương 11: ỨNG DỤNG HÌNH HỌC ĐA GÓC NHÌN VÀO XÂY
DỰNG MÔ HÌNH 3D KẾT HỢP PHÂN TÍCH NGỮ
NGHĨA VÀ PHƯƠNG PHÁP TỐI ƯU LỒI .............. 247
11.1. GIỚI THIỆU.......................................................................... 247
11.2. MÔ TẢ THUẬT TOÁN ........................................................ 248
11.2.1. Phân tích ngữ nghĩa ........................................................... 249
11.2.2. Xây dựng lại cảnh quan trong trường hợp đặc biệt ........... 253
11.2.3. Đối sánh theo phương pháp cặp ảnh stereo ....................... 259
11.3. THỰC NGHIỆM TRÊN TẬP DỮ LIỆU THỰC .................. 260
11.4. KẾT LUẬN ........................................................................... 263
Chương 12: ỨNG DỤNG HÌNH HỌC ĐA GÓC NHÌN TRONG
ĐỊNH VỊ CHO MÁY ẢNH ĐA HƯỚNG ................... 264
12.1. GIỚI THIỆU.......................................................................... 264
12.2. MÔ TẢ THUẬT TOÁN ........................................................ 264
12.2.1. Ước tính các cặp chuyển động xoay .................................. 265
12.2.2. Biến đổi camera đa hướng trong mô hình cầu ................... 266
12.2.3. Trích đặc trưng đường ....................................................... 267
12.2.4. Phát hiện điểm vô cực dựa trên phương pháp RANSAC ...... 270
12.2.5. Tìm các điểm vô cực tương đồng dựa trên phương pháp ước
lượng chuyển động xoay ..................................................... 271
12.3. TÍNH TOÁN GÓC XOAY TOÀN CỤC CỦA CAMERA .... 273
12.4. SỰ PHỤC HỒI CHUYỂN ĐỘNG CỦA CAMERA ............ 273
12.4.1. Điểm tương đồng trên gương cầu ...................................... 273
12.4.2. Chuyển động của camera với ma trận xoay đã biết ........... 273
12.4.3. Tối ưu hóa trong mô hình hình cầu ................................... 275
12.4.3. Tối ưu gần lồi sử dụng ngưỡng giữa ................................. 277
12.5. THỰC NGHIỆM ................................................................... 278
8
12.6. KẾT LUẬN ........................................................................... 284
Chương 13: ỨNG DỤNG THỊ GIÁC MÁY TÍNH KẾT HỢP
BIẾN GPS TRONG ĐỊNH VỊ ROBOT ...................... 281
13.1. GIỚI THIỆU.......................................................................... 281
13.2. MÔ TẢ THUẬT TOÁN ........................................................ 284
13.3. HỆ THỐNG ĐO LƯỜNG BẰNG THỊ GIÁC DỰA TRÊN
CAMERA ĐA HƯỚNG ........................................................... 286
13.3.1. Phân tích mô hình di chuyển ............................................. 286
13.3.2. Hệ thống đo lường bằng hình ảnh ..................................... 290
13.4. SỰ HIỆU CHỈNH SAI SỐ ĐO VỊ TRÍ CỦA HỆ THỐNG NHỜ
VÀO THÔNG TIN DẪN ĐƯỜNG QUA VỆ TINH (GPS) .... 293
13.4.1. Đánh giá giá trị đo từ hệ thống định vị toàn cầu ............... 293
13.4.2. Hiệu chỉnh vị trí dựa trên hệ thống định vị toàn cầu ......... 295
13.5. KẾT QUẢ THỰC NGHIỆM ................................................ 295
13.6. KẾT LUẬN ........................................................................... 298
Phụ lục A .............................................................................................. 300
Phụ lục B .............................................................................................. 306
TÀI LIỆU THAM KHẢO.
LINK THƯ VIỆN CÁC TRƯỜNG ĐH/CĐ ĐỂ MƯỢN SÁCH/XEM ONLINE
LINK ĐẶT MUA SÁCH ONLINE
Không có nhận xét nào: