Các nhà nghiên cứu tại phòng thí nghiệm machine learning của OpenAI đã phát hiện ra hệ thống trí tuệ nhân tạo của họ có thể dễ dàng bị đánh lừa bởi một cách đơn giản đến bất ngờ. Như minh họa trong hình ảnh bên dưới, chỉ cần viết tên của một món đồ vật và dán nó lên một đồ vật khác, là đã đủ để đánh lừa hệ thống AI tiên tiến này.
“Chúng tôi gọi đây là một dạng tấn công typographic. Bằng cách khai thác khả năng đọc văn bản của AI, chúng tôi nhận thấy rằng hệ thống AI có thể dễ dàng bị đánh lừa trong khả năng nhận diện các vật thể của mình”, một nhà nghiên cứu tại OpenAI cho biết.
Như trong ví dụ trên, AI có thể dễ dàng nhận diện ra trong bức ảnh là một quả táo Granny Smith (một loại táo có nguồn gốc từ Úc). Tuy nhiên nếu dán lên quả táo một mảnh giấy với dòng chữ iPod, thì AI đã dễ dàng bị đánh lừa và nhận diện rằng đó là một chiếc iPod chứ không phải là một quả táo nữa.
Các nhà nghiên cứu của OpenAI cho rằng dạng tấn công typographic có thể rất nguy hiểm, đặc biệt là đối với các hệ thống AI phải dựa vào thị giác máy tính. Ví dụ như trên những chiếc xe tự lái của Tesla, hệ thống AI có thể dễ dàng bị đánh lừa bằng những nhãn dán trên đường đi, khiến cho nó nhận diện sai vật cản hoặc tự động chuyển làn đường.
Trí tuệ nhân tạo CLIP nhận diện hình ảnh và văn bản.
OpenAI đang phát triển một hệ thống thị giác máy tính mới, có tên là CLIP, nhằm giúp nhận diện một cách chính xác các đối tượng nó nhìn thấy, mà không cần phải trải qua quá trình đào tạo với cơ sở dữ liệu khổng lồ như các AI trước đây. Có thể nói rằng CLIP là tương lai của một mạng máy tính có thể mô phỏng theo cách thức hoạt động của bộ não con người.
Tuy nhiên chính sự ưu việt này của trí tuệ nhân tạo CLIP lại là nhược điểm lớn nhất. Khi mà một con người có thể dễ dàng nhận ra sự khác biệt giữa một quả táo và một tờ giấy có chữ iPod được dán lên quả táo đó. Thì trí tuệ nhân tạo của OpenAI lại không nhận ra được.
Cách thức mà AI này nhận diện các món đồ vật không phải là là thông qua học tập từ cơ sở dữ liệu, mà thông qua một sự liên tưởng trừu tượng. Một ví dụ khác dễ hình dung hơn, đó là hình ảnh một chiếc cưa máy với các ký hiệu $.
Với hình ảnh một chiếc cưa máy thông thường, CLIP có thể dễ dàng nhận diện. Nhưng nếu hình ảnh có chèn thêm một vài ký hiệu đồng USD bên trên, CLIP lại nhận diện ra một con heo đất. Nguyên nhân chính là do sự liên tưởng từ ký hiệu $ tới tiền bạc, dẫn đến sự nhầm lẫn này.
Điều đó cho thấy sự phức tạp khi các nhà nghiên cứu cố gắng tạo ra một trí tuệ nhân tạo máy tính có cách nhận thức và nhìn thế giới giống như một con người.
Tham khảo: theverge