Thứ năm, 14/04/2016 07:45 GMT+7

Hệ thống phát hiện và nhận dạng đối tượng bằng công nghệ 3D Vision

Năm 2015, các nhà nghiên cứu tại Trung tâm Quang điện tử - Viện Ứng dụng công nghệ (Bộ Khoa học và Công nghệ) do TS. Phạm Hồng Tuấn, Giám đốc Trung tâm Quang điện tử dẫn dắt hợp tác với Phòng thí nghiệm AOI - Trường Đại học Kỹ thuật Đài Bắc...

Hệ thu nhận lai hồng ngoại và nhìn thấy

Hiện nay ở Việt Nam, các hệ thống nhận dạng phương tiện giao thông, đếm xe cộ, nhận dạng biển số xe đã bắt đầu dần được áp dụng ví dụ như các phần mềm: TF.BUSMS, TF. LPRS, TF.CPRS của TF Group.Tuy nhiên, các phần mềm hầu hết sử dụng các giải pháp nhận dạng dựa trên công nghệ xử lý ảnh 2D dẫn tới gặp khó khăn trong một số trường hợp nhất định như: Khó có thể phân biệt được ảnh một chiếc ô tô trên tấm Pano hay ô tô đỗ trên đường, một người đang đứng trên vỉa hè hay ảnh người trên tấm quảng cáo, đo thể tích vật thể,... Các yếu điểm này hoàn toàn có thể khắc phục nếu chúng ta sử dụng phương pháp thu nhận và xử lý hình ảnh ba chiều của đối tượng được gọi là 3D Vision. Công nghệ 3D Vision là hệ thống các kĩ thuật nhằm mục đích: Thu nhận ảnh 3 chiều (3D) sự vật xung quanh; Xử lý tự động ảnh 3D số hóa này để phân đoạn, nhận dạng, xác định thuộc tính không gian của đối tượng cần quan tâm, (Vision), phục vụ cho các ứng dụng khác nhau.

Hệ thống thu nhận ảnh 3D do nhóm nghiên cứu chế tạo có cấu hình như sau:
- Kích thước hệ thống: 26x13x14 (cm);
- Dải làm việc 40cm đến 100 cm với độ chính xác nhỏ hơn 5% kích thước tổng với các đối tượng có độ dày lớn hơn 15mm.
- Kết nối với máy tính thông qua cổng HDMI và Video card;
- Camera sử dụng cảm biến hình ảnh Sony 1/3”, có độ phân giải 570x768; góc nhìn DxHxV: 67.1o x 56.3ox43.7o; tốc độ thu thập ảnh: 25fps; Độ dài tiêu cự: 8mm.
- Module chiếu laser bước sóng 808 nm, công suất: 1W, điện áp cấp 12V, độ phân giải: 608x684.

Hệ thu nhận sử dụng ánh sáng nhìn thấy có các thông số:
- Độ phân giải hệ thống: 640x480;
- Số điểm ảnh 3D tối đa thu được: 300.000 điểm;
- Khoảng cách trung bình giữa các điểm: 0,307 mm;
- Khoảng cách thu nhận tới camera: 210 mm ÷ 320 mm;
- Vùng thu nhận: 150x80 mm;
- Độ chính xác hệ thống: 0,5 mm~1.2 mm;

Phần mềm thu thập ảnh 3 chiều do nhóm nghiên cứu thiết lập có khả năng kết nối với camera hồng ngoại qua cổng video card; điều khiển đồng bộ giữa nguồn phát laser hồng ngoại và camera thu ảnh; có khả năng hiển thị ảnh 3 chiều với các chức năng: di ảnh, xoay ảnh, phóng to, thu nhỏ; có khả năng lưu đám mây điểm vào định dạng PLY; có khả năng thực hiện với các thuật toán mã hóa vân sáng khác như Fourier Transform, Phase Shiftting.
Phần mềm phân đoạn và trích lọc các đặc tính đặc trưng của đối tượng đạt được các tiêu chí như sau: Có khả năng phân đoạn nhiều đối tượng trong cùng một ảnh; có khả năng phân đoạn đối tượng bị cho khuất một phần với mức độ che khuất có thể chấp nhận là 40%; phân đoạn ảnh của đối tượng với độ chính xác 80 %; các trích lọc đặc trưng không phụ thuộc vào góc nhìn vật hay vị trí đặt của vật trong không gian; xử lý ảnh thời gian thực.
Phần mềm nhận dạng ảnh ba chiều có khả năng nhận dạng nhiều đối tượng trong cùng một ảnh; có khả năng nhận dạng con người bị che khuất một phần nếu các phần cơ bản (đầu và tay) được thu nhận trong ảnh ba chiều (mức độ che khuất có thể chấp nhận của đối tượng là 35%). Phương pháp nhận dạng có thể áp dụng cho ảnh ba chiều có độ phân dải khác nhau; nhận dạng con người với kết quả độ chính xác 80%; nhận dạng theo thời gian thực.
Các kết quả nghiên cứu của đề tài có ý nghĩa quan trọng đối với sự phát triển của lĩnh vực nghiên cứu xử lý ảnh 3D trong nước, góp phần thúc đẩy các nghiên cứu trong lĩnh vực xử lý ảnh nói chung, tạo tiền đề và cơ sở cho nhiều nghiên cứu tiếp theo, thúc đẩy sự hội nhập và bắt kịp các công nghệ tiên tiến trên thế giới.
Có thể tìm đọc toàn văn Báo cáo kết quả nghiên cứu trên tại Cục Thông tin KH&CN Quốc gia.

Lượt xem: 5132

Tìm theo ngày :

Đánh giá

(Di chuột vào ngôi sao để chọn điểm)