Khóa luận tốt nghiệp Kỹ thuật máy tính: Xây dựng chương trình điều khiển xe tự hành ứng dụng deep learning (Trương Văn Việt & Trần Thảo Nguyên) Full
Từ thực trạng đó đề tàixây dựng chương trình điều khiển xe tự hành ngày càng được nhiều sự quan tâm vàphát triển, các đề xuất về giải pháp được không ngừng phát triển, tiêu biểu là các c
Kiến trúc SSD - Single Shot MultiBox Detector
Các thuật toán thuộc nhóm region proposal tuy cho kết quả có độ chính xác cao, nhưng chúng có một nhược điểm rất lớn là thời gian huấn luyện và đưa quyết định rất chậm Faster R-CNN có tốc độ xử lý khoảng 7 FPS trên tập dữ liệu
PASCAL VOC 2007 Thuật toán Single shot detection chạy khá nhanh, nhưng độ chính xác của nó không cao lắm (không bằng region proposal) Thuật toán có vấn đề về việc nhận dạng các đối tượng có kích thước nhỏ.
Cũng giống như hầu hết các kiến trúc object detection khác, đầu vào của SSD là tọa độ bounding box của vật thê (hay còn gọi là offsets của bounding box) và nhãn của vật thể chứa trong bounding box Điểm đặc biệt làm nên tốc độ của
SSD model là mô hình sử dụng một mạng neural duy nhất Cách tiếp cận của nó dựa trên việc nhận diện vật thé trong các features map (là một output shape 3D của một mang deep CNN sau khi bỏ các fully connected layers cuối) có độ phân giải khác nhau Mô hình sẽ tạo ra một lưới các ô vuông gọi là grid cells trên các feature map, mỗi ô được gọi là một cell và từ tâm của mỗi cell xác định một tập hợp các boxes mặc định (default boxes) dé dự đoán khung hình có khả năng bao quanh vật thé Tai thời điểm dự báo, mạng neural sẽ trả về 2 giá trị đó là: phân phối xác suất nhãn của vật thê chứa trong bounding box và một tọa độ gọi là offsets của bounding box Quá trình huấn luyện cũng là quá trình tinh chỉnh xác suất nhãn và bounding box về đúng với các giá trị ground truth input của mô hình (gồm nhãn và offsets bounding box).
Thêm nữa, network được kết hợp bởi rất nhiều các feature map với những độ phân giải khác nhau giúp phát hiện được những vật thé đa dạng các kích thước và hình dạng Trái với mô hình fast R-CNN, SSD bỏ qua bước tao mặt na region proposal network dé đề xuất vùng vật thé Thay vào đó tat cả quá trình phát hiện vật thể và phân loại vật thê được thực hiện trong cùng | mang Bản thân tên của mô hình - Single Shot MultiBox Detector cũng nói lên được rằng mô hình sử dụng nhiều khung hình box với tỷ lệ scales khác nhau nhằm nhận diện vùng vật thể và phân loại vật thé, giảm thiêu được bước tao region proposal network so với fast R-
CNN nên tăng tốc độ xử lý lên nhiều lần mà tốc độ xử lý vẫn đảm bảo Bên dưới là bảng so sánh tốc độ running của các mô hình object detection.
Kỹ thuật bounding box được sử dụng trong SSD được lấy ý tưởng từ Szegedy, một phương pháp sử dụng nhiều bounding box phù hợp với mọi đối tượng lớn nhỏ. Dưới đây là kiến trúc của multi-scale convolution prediction được sử dụng trong SSD.
...
LINK 3 - TÌM KIẾM SÁCH/TÀI LIỆU ONLINE (GIÁ ƯU ĐÃI NHẤT)
LINK 4 - TÌM KIẾM SÁCH/TÀI LIỆU ONLINE (GIÁ ƯU ĐÃI NHẤT)
Từ thực trạng đó đề tàixây dựng chương trình điều khiển xe tự hành ngày càng được nhiều sự quan tâm vàphát triển, các đề xuất về giải pháp được không ngừng phát triển, tiêu biểu là các c
Kiến trúc SSD - Single Shot MultiBox Detector
Các thuật toán thuộc nhóm region proposal tuy cho kết quả có độ chính xác cao, nhưng chúng có một nhược điểm rất lớn là thời gian huấn luyện và đưa quyết định rất chậm Faster R-CNN có tốc độ xử lý khoảng 7 FPS trên tập dữ liệu
PASCAL VOC 2007 Thuật toán Single shot detection chạy khá nhanh, nhưng độ chính xác của nó không cao lắm (không bằng region proposal) Thuật toán có vấn đề về việc nhận dạng các đối tượng có kích thước nhỏ.
Cũng giống như hầu hết các kiến trúc object detection khác, đầu vào của SSD là tọa độ bounding box của vật thê (hay còn gọi là offsets của bounding box) và nhãn của vật thể chứa trong bounding box Điểm đặc biệt làm nên tốc độ của
SSD model là mô hình sử dụng một mạng neural duy nhất Cách tiếp cận của nó dựa trên việc nhận diện vật thé trong các features map (là một output shape 3D của một mang deep CNN sau khi bỏ các fully connected layers cuối) có độ phân giải khác nhau Mô hình sẽ tạo ra một lưới các ô vuông gọi là grid cells trên các feature map, mỗi ô được gọi là một cell và từ tâm của mỗi cell xác định một tập hợp các boxes mặc định (default boxes) dé dự đoán khung hình có khả năng bao quanh vật thé Tai thời điểm dự báo, mạng neural sẽ trả về 2 giá trị đó là: phân phối xác suất nhãn của vật thê chứa trong bounding box và một tọa độ gọi là offsets của bounding box Quá trình huấn luyện cũng là quá trình tinh chỉnh xác suất nhãn và bounding box về đúng với các giá trị ground truth input của mô hình (gồm nhãn và offsets bounding box).
Thêm nữa, network được kết hợp bởi rất nhiều các feature map với những độ phân giải khác nhau giúp phát hiện được những vật thé đa dạng các kích thước và hình dạng Trái với mô hình fast R-CNN, SSD bỏ qua bước tao mặt na region proposal network dé đề xuất vùng vật thé Thay vào đó tat cả quá trình phát hiện vật thể và phân loại vật thê được thực hiện trong cùng | mang Bản thân tên của mô hình - Single Shot MultiBox Detector cũng nói lên được rằng mô hình sử dụng nhiều khung hình box với tỷ lệ scales khác nhau nhằm nhận diện vùng vật thể và phân loại vật thé, giảm thiêu được bước tao region proposal network so với fast R-
CNN nên tăng tốc độ xử lý lên nhiều lần mà tốc độ xử lý vẫn đảm bảo Bên dưới là bảng so sánh tốc độ running của các mô hình object detection.
Kỹ thuật bounding box được sử dụng trong SSD được lấy ý tưởng từ Szegedy, một phương pháp sử dụng nhiều bounding box phù hợp với mọi đối tượng lớn nhỏ. Dưới đây là kiến trúc của multi-scale convolution prediction được sử dụng trong SSD.
...
LINK 3 - TÌM KIẾM SÁCH/TÀI LIỆU ONLINE (GIÁ ƯU ĐÃI NHẤT)
LINK 4 - TÌM KIẾM SÁCH/TÀI LIỆU ONLINE (GIÁ ƯU ĐÃI NHẤT)

%20(1).png)

.png)
Không có nhận xét nào: