'Chìa khóa công nghệ' của xe tự hành

ThS Trương Đình Dũng (Trường Cao đẳng Kỹ thuật Thông tin - Hà Nội) |

Yêu cầu không thể thiếu với xe tự hành là phải tự nhận diện được các đối tượng tham gia giao thông và không gian làn đường…

Kỹ thuật phân đoạn ảnh là nền tảng của tính năng này.

Gia tăng độ an toàn cho xe tự lái

Công nghệ xe tự lái là một lĩnh vực mới và đang được các doanh nghiệp Việt Nam đón đầu phát triển trên cơ sở của cuộc Cách mạng công nghiệp lần thứ 4.

Các mẫu xe sở hữu công nghệ thông minh, đáp ứng mục tiêu nâng cao chất lượng sống của người dân trong tương lai đô thị thông minh, thân thiện với môi trường...

Lợi ích của xe tự lái là có thể thay thế con người làm chủ vô lăng đến 90%. Khả năng này ngày càng được cải thiện để gia tăng độ an toàn và hạn chế một số rủi ro nhất định.

Trong quá trình xử lý của xe tự hành, ứng dụng kỹ thuật phân đoạn ảnh cung cấp các thông tin về không gian làn đường, phát hiện các đối tượng tham gia giao thông để hỗ trợ cho quá trình tự lái.

Quá trình xử lý ảnh là nâng cao chất lượng ảnh và xử lý số liệu cung cấp cho các quá trình khác, trong đó có việc ứng dụng thị giác vào điều khiển. Đã có rất nhiều công trình nghiên cứu tại các quốc gia từ năm 1920 về xử lý ảnh, trong đó có kỹ thuật phân đoạn ảnh.

Kỹ thuật phân đoạn ảnh là việc phân loại ảnh thành các nhóm khác nhau. Phân đoạn ảnh ứng dụng đối với xe tự lái sử dụng thuật toán phân cụm K-means, là thuật toán dựa trên học không giám sát (Unsupervised learning) để tách các đối tượng theo nhóm.

Để nhận dạng ảnh trở nên dễ dàng thì ảnh cần phải tách thành các đối tượng riêng biệt. Nếu phân đoạn ảnh không tốt sẽ dẫn đến sai lầm trong quá trình nhận dạng. Phân đoạn ảnh nhằm phân tích ảnh thành những thành phần có cùng tính chất dựa theo biên hay các vùng liên thông.

Một cách tổng quát, phân đoạn ảnh được định nghĩa như việc chia hình ảnh thành các đối tượng độc lập với nhau dựa trên các đặc tính của ảnh như mức xám hay kết cấu của ảnh.

Dựa vào đặc tính vật lý của vùng ảnh, có thể có nhiều kỹ thuật phân đoạn ảnh như: Phương pháp ngưỡng, tách biên, phương pháp thống kê MLC (Maximum likehood classifier), phương pháp dựa trên mạng

nơ-ron, phương pháp dựa trên các thuật toán phân cụm dữ liệu. Thông thường, các kỹ thuật dựa trên phân cụm trả về kết quả là nhiều hơn 2 cụm, trong khi đó các phương pháp dựa trên ngưỡng trả về là 2 cụm. Thuật toán phân cụm là phương pháp phổ biến được sử dụng trong kỹ thuật phân đoạn ảnh.

Ứng dụng phân đoạn ảnh đối với xe tự hành

Phân cụm là kỹ thuật rất quan trọng trong khai phá dữ liệu, nó thuộc lớp các phương pháp học không giám sát trong học máy (Machine learning). Thuật toán phân cụm K-means được giới thiệu năm 1957 bởi Lloyd K-means và là phương pháp phổ biến nhất cho việc phân cụm.

Tư tưởng chính của thuật toán K-Means là tìm cách phân nhóm các đối tượng đã cho vào k cụm (k là số các cụm được xác định trước, k nguyên dương) sao cho tổng bình phương khoảng cách giữa các đối tượng đến tâm nhóm (centroid) là nhỏ nhất.

Về cơ bản, thuật toán phân cụm K-means sử dụng phương pháp tạo và cập nhật trung tâm để phân nhóm các điểm dữ liệu cho trước vào các nhóm khác nhau.

Ô tô tự lái, kết hợp tính năng tự động hóa phương tiện, có khả năng cảm nhận môi trường và di chuyển an toàn mà không cần hoặc không có sự tham gia của con người.

Trong quá trình vận hành, phân đoạn ảnh cung cấp các thông tin về không gian ở trên đường, phát hiện các đối tượng và các biển báo giao thông, xác định làn đường, các xe ô tô, người đi bộ… để hỗ trợ cho ô tô tự lái.

Qua thực nghiệm cho thấy rằng, kết quả của việc phân đoạn tốt và ổn định phụ thuộc rất nhiều vào tham số k tâm cụm được khởi tạo. Trong trường hợp k tâm cụm khởi tạo này có độ lệch thực tế lớn thì kết quả của việc phân cụm là thấp.

Để khắc phục điểm yếu này, có thể thực hiện giải pháp tính toán trước khi thực hiện phân cụm. Theo đó, gộp nhóm các điểm ảnh có cùng màu sắc, sắp xếp chọn ra k nhóm màu có số lượng điểm ảnh nhỏ nhất và khởi tạo k tâm cụm là một trong các điểm ảnh của k nhóm này.

Nhược điểm của phương pháp này là đối với ảnh đầu vào có kích thước lớn và khoảng các giá trị màu sắc rộng thì phải chịu khá nhiều chi phí tính toán, sắp xếp để tính được k nhóm màu có số lượng điểm ảnh lớn nhất. Tuy nhiên, kết quả phân cụm của phương pháp bảo đảm tốt hơn việc khởi tạo ngẫu nhiên.

Đường dây nóng: 0943 113 999

Soha
Báo lỗi cho Soha

*Vui lòng nhập đủ thông tin email hoặc số điện thoại