Đọc suy nghĩ cứ tưởng như chỉ có trong phim, hóa ra lại sắp xuất hiện ngoài đời thực: các nhà khoa học đã phát triển được một trí tuệ nhân tạo có thể biến hoạt động não thành văn bản.

Dù hệ thống hiện tại hoạt động bằng cách đọc các mô hình thần kinh xuất hiện khi ai đó đang nói, các chuyên gia khẳng định trong tương lai, nó có thể hỗ trợ việc cho việc giao tiếp của các bệnh nhân không thể nói hoặc gõ, như những người bị "hội chứng khóa trong".

"Chúng ta chưa đạt đến mức đó, nhưng chúng tôi nghĩ đây có thể là nền tảng ban đầu cho công nghệ giả giọng nói" – Tiến sỹ Joseph Makin, đồng tác giả nghiên cứu, làm việc tại Đại học California, cho biết.

Makin và các đồng nghiệp tiết lộ rằng họ đã phát triển hệ thống của mình bằng cách tuyển 4 người tham gia và gắn vào não họ những mảng điện cực để theo dõi tình trạng động kinh.

Những người tham gia được yêu cầu đọc to 50 câu nói nhiều lần, bao gồm "Tina Turner là một ca sỹ nhạc pop", "Những tên cướp kia đã đánh cắp 30 viên kim hoàn"… Nhóm nghiên cứu đã theo dõi hoạt động thần kinh của họ trong khi họ đang nói.

Dữ liệu thu được được cho vào một thuật toán machine-learning, một kiểu hệ thống trí tuệ nhân tạo có thể chuyển dữ liệu hoạt động não liên quan mỗi câu được nói ra thành một dãy các con số.

Để đảm bảo những con số đó chỉ liên quan đến các khía cạnh của lời nói, hệ thống đã so sánh những âm thanh dự đoán được từ nhiều phần nhỏ của dữ liệu hoạt động não với âm thanh được thu âm thực sự. Dãy các con số sau đó được cho vào phần thứ hai của hệ thống có chức năng chuyển nó thành một chuỗi các từ ngữ.

Ban đầu, hệ thống cho ra những câu chẳng có chút ý nghĩa. Nhưng khi hệ thống so sánh mỗi chuỗi từ vựng với các câu nói được người tham gia đọc to ra, nó đã được cải thiện và học được mối liên hệ giữa chuỗi các con số với các từ, và những từ nào sẽ có xu hướng đi với nhau.

Nhóm nghiên cứu sau đó đã thử nghiệm hệ thống lần nữa, tạo ra được văn bản viết chỉ từ hoạt động não trong quá trình nói.

Hệ thống vẫn chưa hoàn hảo. Ví dụ, "Those musicians harmonise marvellously" bị giải mã nhầm thành "The spinach was a famous singer", và "A roll of wire lay near the wall" trở thành "Will robin wear a yellow lily".

Tuy nhiên, nhóm nghiên cứu đã phát hiện ra rằng độ chính xác của hệ thống mới đã cao hơn nhiều so với các hướng tiếp cận trước đây.

Dù độ chính xác đối với mỗi người là khác nhau, trung bình chỉ có 3% trong mỗi câu là cần được sửa – tức độ chính xác cao hơn so với các chuyên gia dịch thuật con người, vốn có tỉ lệ lỗi từ vào khoảng 5%. Nhưng nhóm nghiên cứu nhấn mạnh rằng không như con người, thuật toán chỉ có thể xử lý một lượng nhỏ các câu nói mà thôi.

"Nếu bạn thử ngoài 50 câu được sử dụng, AI sẽ giải mã tệ hơn nhiều" – Makin nói, tiết lộ thêm rằng hệ thống nhiều khả năng dựa vào sự kết hợp của việc học nhiều câu cụ thể, xác định các từ từ hoạt động của não, và nhận dạng các mô hình chung trong tiếng Anh.

Nhóm nghiên cứu còn phát hiện ra rằng nếu huấn luyện thuật toán bằng dữ liệu của một người tham gia thì sẽ cần ít dữ liệu huấn luyện từ người dùng cuối cùng hơn – nhờ đó quá trình huấn luyện có thể sẽ ít gây khó chịu cho các bệnh nhân hơn.

Tiến sỹ Christian Herff, một chuyên gia từ Đại học Maastricht, người không tham gia nghiên cứu, nói rằng nghiên cứu này thực sự thú vị bởi hệ thống chỉ sử dụng chưa đến 40 phút dữ liệu huấn luyện đối với từng người tham gia, và một tập hợp với số lượng câu hạn chế, chứ không cần đến hàng triệu giờ huấn luyện như các thuật toán thông thường cần đến.

"Bằng cách làm như vậy, họ đã đạt được độ chính xác mà cho đến nay chưa ai từng đạt được" – ông nói.

Tuy nhiên, ông lưu ý rằng hệ thống này vẫn chưa hữu dụng đối với nhiều bệnh nhân khuyết tật nặng, bởi nó dựa vào hoạt động não ghi được từ người có thể nói to ra một câu.

"Tất nhiên đây là một nghiên cứu tuyệt vời, nhưng những bệnh nhân đó cũng có thể sử dụng ‘OK Google’ cho nhanh" – ông nói. "Đây không phải là phiên dịch suy nghĩ, mà là phiên dịch hoạt động não trong quá trình nói"

Herff nói rằng mọi người không nên quá lo lắng về việc người khác đọc được suy nghĩ của họ: muốn đọc được, bạn phải gắn các điện cực não, và những câu nói tưởng tượng trong đầu cũng rất khác biệt so với suy nghĩ và cảm xúc của mỗi người.

Nhưng Tiến sỹ Mahnaz Arvaneh, một chuyên gia về giao diện máy não tại Đại học Sheffield, nói rằng cần phải xem xét đến các vấn đề đạo đức. "Chúng ta vẫn rất, rất xa thời điểm mà máy móc có thể đọc ý nghĩa của chúng ta" – bà nói. "Nhưng điều đó không có nghĩa chúng ta không nên nghĩ về nó và không nên lên kế hoạch trước về nó".

Tham khảo: TheGuardian