Theo đó, nhóm nghiên cứu tại Wayve - một công ty được thành lập bởi các nhà phát triển đến từ Khoa Kỹ sư thuộc Đại học Cambridge - đã công bố chi tiết thuật toán "học tăng cường" của họ trên một bài blog vào ngày 28/6.
Thuật toán này, khi đi kèm với một tài xế con người đóng vai trò dự phòng, đã "dạy" được chiếc xe chạy trên một làn đường duy nhất trong thời gian từ 15-20 phút.
"Học tăng cường" đối với AI đã được chứng minh là mang lại hiệu quả rất cao trước đó, với việc DeepMind Technologies biểu diễn AI có thể học chơi các game như cờ vây hay cờ vua, và OpenAI trình làng AI có thể chơi số trận Dota 2 mỗi ngày tương đương với 180 ngày của người chơi thông thường.
Dù thành tích đánh bại con người trong các tựa game phức tạp như cờ vây hay Dota 2 quả thực rất ấn tượng, nhưng việc dạy một chiếc xe tự lái chính nó lại là một kỹ năng cực kỳ khó thực hiện khác.
Nhóm nghiên cứu đã đăng một đoạn video lên kênh YouTube của họ nhằm cho mọi người thấy quá trình học này, qua đó chỉ ra rằng đây là "ví dụ đầu tiên của 'học tăng cường' được thực hiện trên một chiếc xe tự hành".
AI "dạy" xe tự lái đi đúng làn
Ban đầu, chiếc xe chạy quanh co như một đứa trẻ mới biết đi chập chững những bước đầu tiên, nhưng ngay khi nó vượt ra khỏi làn, một tài xế dự phòng (là con người) can thiệp, lái nó trở lại đúng đường đi. Thuật toán trên xe sẽ học được sai lầm của nó mỗi lần nó được người tài xế này "sửa lỗi", và được "thưởng" tùy theo độ dài quãng đường nó đi được mà không cần can thiệp.
Đoạn video trên còn miêu tả một mô hình gọi là "mạng thần kinh xoắn ốc sâu" có nhiệm vụ tiếp nhận một hình ảnh đơn lẻ được xử lý bằng GPU tích hợp trên xe.
Không như các phương tiện tự lái khác, chiếc Renault đã được chỉnh sửa của Wayve không đòi hỏi phải được trang bị "các mô hình khổng lồ, các cảm biến ấn tượng, và nguồn dữ liệu vô tận", mà nó tuân theo triết lý của công ty là sử dụng "một quá trình huấn luyện thông minh chú trọng học nhanh và hiệu quả".
Đồng sáng lập của Wayve là Amar Shah cho biết: "Chúng tôi muốn trang bị cho các phương tiện những bộ não tốt hơn, chứ không phải nhiều phần cứng hơn".
Nhiệm vụ tiếp theo của Wayve là mở rộng quy mô của công nghệ này để thực hiện được nhiều tác vụ lái xe phức tạp hơn, không chỉ là đi đúng làn đường, với kỳ vọng hệ thống này cuối cùng sẽ có thể "xử lý khi gặp đèn giao thông hay đi qua các vòng xoay, giao lộ".