Giáo trình được biên soạn với mục tiêu trang bị cho người học nền tảng kiến thức vững chắc và kỹ năng thực hành chuyên sâu. Sau khi hoàn thành giáo trình này, sinh viên sẽ có khả năng:
• Hiểu rõ cơ chế thu nhận, biểu diễn ảnh số và nắm vững các kỹ thuật xử lý ảnh kinh điển làm cơ sở cho các bài toán thị giác máy tính.
• Làm chủ các kiến trúc học sâu (Deep Learning) hiện đại nhất như CNNs, Transformers, các họ mô hình YOLO, R-CNN trong bài toán phát hiện và nhận dạng đối tượng.
• Có khả năng cài đặt, lập trình các thuật toán thị giác máy tính bằng ngôn ngữ Python cùng các thư viện phổ biến (OpenCV, PyTorch) để giải quyết các bài toán thực tế.
• Biết cách phân tích yêu cầu, lựa chọn mô hình phù hợp và đánh giá hiệu quả của hệ thống trong các ứng dụng cụ thể như y tế, giao thông thông minh hay robotics.
Giáo trình được cấu trúc thành 6 chương chính, cung cấp kiến thức theo lộ trình từ nền tảng đến chuyên sâu trong thị giác máy tính. Cấu trúc cụ thể như sau:
Giáo trình được biên soạn với mục tiêu trang bị cho người học nền tảng kiến thức vững chắc và kỹ năng thực hành chuyên sâu. Sau khi hoàn thành giáo trình này, sinh viên sẽ có khả năng:
• Hiểu rõ cơ chế thu nhận, biểu diễn ảnh số và nắm vững các kỹ thuật xử lý ảnh kinh điển làm cơ sở cho các bài toán thị giác máy tính.
• Làm chủ các kiến trúc học sâu (Deep Learning) hiện đại nhất như CNNs, Transformers, các họ mô hình YOLO, R-CNN trong bài toán phát hiện và nhận dạng đối tượng.
• Có khả năng cài đặt, lập trình các thuật toán thị giác máy tính bằng ngôn ngữ Python cùng các thư viện phổ biến (OpenCV, PyTorch) để giải quyết các bài toán thực tế.
• Biết cách phân tích yêu cầu, lựa chọn mô hình phù hợp và đánh giá hiệu quả của hệ thống trong các ứng dụng cụ thể như y tế, giao thông thông minh hay robotics.
Giáo trình được cấu trúc thành 6 chương chính, cung cấp kiến thức theo lộ trình từ nền tảng đến chuyên sâu trong thị giác máy tính. Cấu trúc cụ thể như sau: