Gậy ông đập lưng ông, hệ thống reCAPTCHA của Google bị chính công cụ của Google đánh bại

Nguyễn Hải |

Dù Google đã sửa đổi và nâng cấp các công cụ của mình, phương pháp mới của các nhà nghiên cứu vẫn đạt tỷ lệ thành công hơn 90%.

Kể từ buổi bình minh của CAPTCHA – những bài kiểm tra được các website sử dụng nhằm lọc các bot truy cập vào nội dung của họ - các chuyên gia và những nhà nghiên cứu bảo mật đã tìm nhiều cách để qua mặt nó. Một số phương pháp đã được sử dụng như kỹ thuật nghịch đảo hình ảnh, kỹ thuật học sâu của trí tuệ nhân tạo hoặc dữ liệu thần kinh học thử nghiệm.

Giờ đây các nhà nghiên cứu tại Đại học Maryland tuyên bố phương pháp đánh lừa CAPTCHA mới của họ, với tên UnCaptcha, có thể đánh lừa cả hệ thống reCaptcha của Google, một trong những hệ thống CAPTCHA nổi tiếng nhất hiện đang được hàng trăm nghìn website sử dụng. Theo tuyên bố của các nhà nghiên cứu, tỷ lệ thành công của họ đạt tới 90%.

Gậy ông đập lưng ông, hệ thống reCAPTCHA của Google bị chính công cụ của Google đánh bại - Ảnh 1.

Trớ trêu hơn, phương pháp này sử dụng chính dịch vụ speech-to-text (dịch vụ chuyển giọng nói thành text) của Google để qua mặt reCaptcha.

Phiên bản UnCaptcha được phát triển từ năm 2017, nhằm sử dụng dịch vụ speech-to-text miễn phí của Google để làm hệ thống nghĩ rằng robot đang truy cập là con người.

Theo tài liệu của các nhà nghiên cứu, UnCaptcha sẽ tải xuống đoạn audio captcha, chia đoạn audio thành các mẩu âm thanh riêng biệt phát âm ra các chữ số, sau đó tải chúng lên hàng loạt dịch vụ speech-to-text khác nhau (bao gồm cả của Google).

Khi các dịch vụ này trả về các đoạn text, những nhà nghiên cứu sẽ chuyển chúng thành những con số. Sau khi thực hiện việc đoán gần đúng từ phát âm, hệ thống có thể quyết định đoạn speech-to-text đầu ra nào chính xác nhất và đăng tải câu trả lên ô CAPTCHA. Phương pháp cũ này mang lại tỷ lệ thành công đến 85%.

Sau khi phát hành phiên bản UnCaptcha này, Google đã sửa lại một số lỗ hổng đang bị UnCaptcha lợi dụng để hoạt động, bao gồm cả khả năng phát hiện hệ thống tự động trên trình duyệt tốt hơn và đổi sang việc phát âm các cụm từ, thay vì chỉ các chữ cái.

Các nhà nghiên cứu cũng cập nhật lại phương pháp của mình vào tháng Sáu vừa qua, và giờ đây hệ thống mới đã qua mặt được các thay đổi mới của Google và thậm chí còn đạt tới độ chính xác tới 90%.

Theo phần code của dự án lưu trên GitHub, Google đã biết về phương pháp mới này và cảm thấy không lo lắng về điều đó. Các nhà nghiên cứu cho biết: "Chúng tôi đã liên hệ với nhóm ReCaptcha từ hơn 6 tháng nay và họ hoàn toàn biết về cách thức tấn công này. Nhóm cũng cho phép chúng tôi phát hành code của mình, dù thành công trong cách thức tấn công hiện tại."

Tham khảo Motherboard

Đường dây nóng: 0943 113 999

Soha
Báo lỗi cho Soha

*Vui lòng nhập đủ thông tin email hoặc số điện thoại