ỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI



biến trong lĩnh vực xử lý ảnh khi chúng ta cần xác định vị trí và tư thế của một đối tượng. Mức ý nghĩa ở đây là chúng ta phải rút ra được những đặc điểm chính, những đặc điểm đó là những đặc trưng của đối tượng ( có thể mô tả được đối tượng).

Ở trong đề tài này, chúng em muốn đề cập đến bài toán Human Pose Estimation, tức là xác định và chỉ ra được một phần/ toàn bộ các phần chính của cơ thể con người (vd vai, khuỷu tay, cổ tay, đầu gối v.v).

Ở đây chúng em trình bày một cách tiếp cận để phát hiện tư thế 2D của nhiều người trong một hình ảnh. Cách tiếp cận sử dụng một biểu diễn không theo tỷ lệ để tìm hiểu cách liên kết các bộ phận cơ thể với các cá nhân trong hình ảnh. 

Nhận dạng tư thế 2D của con người - vấn đề kết nối các điểm chính hoặc các bộ phận, trong đó phần lớn tập trung vào việc tìm kiếm các bộ phận cơ thể của các cá nhân. Từ đó, ta suy ra dạng tư thế của nhiều người trong các hình ảnh.

Trong đề tài này chúng em sử dụng thuật toán nhận tư thế con người, đã được thực hiện bằng cách sử dụng Tensorflow. Nó cũng cung cấp một số biến thể có một số thay đổi về cấu trúc mạng để xử lý thời gian thực trên CPU hoặc các thiết bị nhúng công suất thấp. Ở đây chúng em sẽ sử dụng mô hình được huấn luyện sẵn để chỉ ra các phần chính của cơ thể con người. 

Trong quá trình thực hiện, xuất hiện nhiều khó khăn. Đầu tiên, mỗi hình ảnh có thể chứa một số lượng người không xác định có thể xảy ra ở bất kỳ vị trí hoặc tỷ lệ nào. Thứ hai, sự tương tác giữa mọi người gây ra sự can thiệp không gian phức tạp, do tiếp xúc, tắc và khớp nối chi, làm cho việc liên kết các bộ phận trở nên khó khăn. Thứ ba, độ phức tạp thời gian chạy có xu hướng tăng theo số lượng người trong ảnh, khiến cho hiệu suất thời gian thực trở thành một thách thức.

Tuy gặp một số khó khăn như trên tuy nhiên vẫn thu được kết quả cơ bản của phần nhận diện này sẽ là dạng tư thế của người sử dụng được nhận trực tiếp từ video với thời gian thực soft real time, bao gồm các điểm chính của cơ thể.


NỘI DUNG:


1. GIỚI THIỆU 1

1.1 Tổng quan 1

1.2 Nhiệm vụ đề tài 1

1.3 Đối tượng phạm vi đề tài 2

1.4 Phương pháp nghiên cứu 2

1.5 Phân chia công việc nhóm 2

2. LÝ THUYẾT 3

2.1 Tổng quan về nhận diện tư thế 3

2.2 Deep Learning 4

2.3 Mạng Nơ-ron tích chập (CNN) 8

2.4 Áp dụng CNN vào bài toán nhận diện tư thế 12

3 THIẾT KẾ VÀ THỰC HIỆN PHẦN MỀM 13

3.1 Yêu cầu đặt ra 13

3.2 Phân tích định hướng 13

3.3 Lưu đồ giải thuật 14

4 KẾT QUẢ THỰC HIỆN 18

4.1 Dữ liệu thực hiện 18

4.2 Kết quả thực hiện 19

5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 22

5.1 Kết luận 22

5.2 Hướng phát triển 22

6 TÀI LIỆU THAM KHẢO 22



LINK DOWNLOAD



biến trong lĩnh vực xử lý ảnh khi chúng ta cần xác định vị trí và tư thế của một đối tượng. Mức ý nghĩa ở đây là chúng ta phải rút ra được những đặc điểm chính, những đặc điểm đó là những đặc trưng của đối tượng ( có thể mô tả được đối tượng).

Ở trong đề tài này, chúng em muốn đề cập đến bài toán Human Pose Estimation, tức là xác định và chỉ ra được một phần/ toàn bộ các phần chính của cơ thể con người (vd vai, khuỷu tay, cổ tay, đầu gối v.v).

Ở đây chúng em trình bày một cách tiếp cận để phát hiện tư thế 2D của nhiều người trong một hình ảnh. Cách tiếp cận sử dụng một biểu diễn không theo tỷ lệ để tìm hiểu cách liên kết các bộ phận cơ thể với các cá nhân trong hình ảnh. 

Nhận dạng tư thế 2D của con người - vấn đề kết nối các điểm chính hoặc các bộ phận, trong đó phần lớn tập trung vào việc tìm kiếm các bộ phận cơ thể của các cá nhân. Từ đó, ta suy ra dạng tư thế của nhiều người trong các hình ảnh.

Trong đề tài này chúng em sử dụng thuật toán nhận tư thế con người, đã được thực hiện bằng cách sử dụng Tensorflow. Nó cũng cung cấp một số biến thể có một số thay đổi về cấu trúc mạng để xử lý thời gian thực trên CPU hoặc các thiết bị nhúng công suất thấp. Ở đây chúng em sẽ sử dụng mô hình được huấn luyện sẵn để chỉ ra các phần chính của cơ thể con người. 

Trong quá trình thực hiện, xuất hiện nhiều khó khăn. Đầu tiên, mỗi hình ảnh có thể chứa một số lượng người không xác định có thể xảy ra ở bất kỳ vị trí hoặc tỷ lệ nào. Thứ hai, sự tương tác giữa mọi người gây ra sự can thiệp không gian phức tạp, do tiếp xúc, tắc và khớp nối chi, làm cho việc liên kết các bộ phận trở nên khó khăn. Thứ ba, độ phức tạp thời gian chạy có xu hướng tăng theo số lượng người trong ảnh, khiến cho hiệu suất thời gian thực trở thành một thách thức.

Tuy gặp một số khó khăn như trên tuy nhiên vẫn thu được kết quả cơ bản của phần nhận diện này sẽ là dạng tư thế của người sử dụng được nhận trực tiếp từ video với thời gian thực soft real time, bao gồm các điểm chính của cơ thể.


NỘI DUNG:


1. GIỚI THIỆU 1

1.1 Tổng quan 1

1.2 Nhiệm vụ đề tài 1

1.3 Đối tượng phạm vi đề tài 2

1.4 Phương pháp nghiên cứu 2

1.5 Phân chia công việc nhóm 2

2. LÝ THUYẾT 3

2.1 Tổng quan về nhận diện tư thế 3

2.2 Deep Learning 4

2.3 Mạng Nơ-ron tích chập (CNN) 8

2.4 Áp dụng CNN vào bài toán nhận diện tư thế 12

3 THIẾT KẾ VÀ THỰC HIỆN PHẦN MỀM 13

3.1 Yêu cầu đặt ra 13

3.2 Phân tích định hướng 13

3.3 Lưu đồ giải thuật 14

4 KẾT QUẢ THỰC HIỆN 18

4.1 Dữ liệu thực hiện 18

4.2 Kết quả thực hiện 19

5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 22

5.1 Kết luận 22

5.2 Hướng phát triển 22

6 TÀI LIỆU THAM KHẢO 22



LINK DOWNLOAD

M_tả
M_tả

Không có nhận xét nào: