Các nhà nghiên cứu của Đại học California, San Francisco (UCSF) đã tận dụng trí thông minh nhân tạo để giúp một người đàn ông bị liệt có thể giao tiếp bằng cách chuyển các tín hiệu não của anh ta thành chữ viết trên máy tính.
Nghiên cứu này được công bố trên Tạp chí Y học New England.
Đối với những người chỉ gặp trở ngại về lời nói, họ có thể dùng các thiết bị như bàn phím hoặc thiết bị tạo giọng nói để giao tiếp. Nhưng đối với những bệnh nhân bị liệt cả nói và vận động, đây là điều không thể.
Tỷ lệ chung của chấn thương sọ não, tai biến mạch máu não và liệt trên toàn cầu lên tới 939 trường hợp trên 100.000 người và hàng năm có tới hàng triệu người bị mất đi khả năng vận động, theo Researchgate.
Niềm hy vọng lớn lao
Dự án này do tiến sĩ Edward Chang, một nhà giải phẫu thần kinh học thuộc Đại học California, San Francisco, Mỹ làm trưởng nhóm và tình nguyện viên là một người bị đột quỵ dẫn đến mất khả năng nói và vận động sau 1 tai nạn giao thông vào năm 2003.
Một Module được gắn lên đỉnh đầu người đàn ông với chức năng phân tích các mô hình từ não và chuyển hóa thành từ và câu. (Ảnh: Euronews)
Một thiết bị thần kinh bao gồm các điện cực được đặt ở phía bên trái của não, qua một số vùng trong não bộ có chức năng điều khiển giọng nói. Một câu hỏi được hiển thị cho người tham gia và thiết bị ghi lại hoạt động não bộ khi anh ta cố gắng nói và trả lời. Trong khi đó, trí thông minh nhân tạo sẽ dịch các mô hình hoạt động của não thành các từ và câu trong thời gian thực.
"Các mô hình của chúng tôi cần học cách lập bản đồ giữa các mô hình hoạt động của não bộ phức tạp và lời nói dự định", theo David Moses, một trong những tác giả chính của dự án cho biết.
Sean Metzger, đồng trưởng nhóm nghiên cứu cho biết việc sử dụng mạng nơ-ron là điều cần thiết để đạt được hiệu suất phân loại và phát hiện.
Tình huống bất ngờ
Nhóm UCSF đã bắt tay vào 50 buổi huấn luyện, tạo ra hơn 1.000 từ được giải mã với độ chính xác lên đến 93% và tỷ lệ trung bình là 75%, với tốc độ 18 từ mỗi phút. Nghiên cứu mới nhất được xây dựng dựa trên công trình trước đó của Chang và nhóm của ông, họ đã phát triển một phương pháp học sâu để giải mã và chuyển đổi tín hiệu não.
Vào năm 2017, Facebook đã thành lập Facebook Reality Labs (FRL) với một mục tiêu dài hạn đầy tham vọng: phát triển một giao diện "giọng nói im lặng", không xâm lấn được kích hoạt bằng suy nghĩ. Dự án Steno của Facebook đã được khởi động vào năm 2019 trong Phòng thí nghiệm Chang tại UCSF.
Tuy nhiên sau đó họ đã rút khỏi dự án Steno, thay vào đó Facebook tìm cách tập trung vào công nghệ đeo cổ tay hoặc thiết bị đeo để quét tín hiệu não. "Chúng tôi đã quyết định tập trung nỗ lực trước mắt vào một phương pháp tiếp cận giao diện thần kinh khác có một con đường tiếp cận thị trường ngắn hạn hơn: cổ tay", theo phát ngôn viên của Facebook.
Nghiên cứu khoa học nhiều ý nghĩa
Theo đánh giá từ các chuyên gia trong ngành, cách tiếp cận mới này có tiềm năng trong việc cải thiện khả năng giao tiếp và cải thiện chất lượng cuộc sống ở những bệnh nhân bị liệt và rối loạn ngôn ngữ. Nếu dự án này thành công và được đưa vào sử dụng thương mại, hẳn sẽ là một điều vô cùng ý nghĩa với hàng triệu người đã bị mất đi khả năng giao tiếp trên toàn thế giới.
Một dự án tương tự cũng đang được tiến hành bởi giáo sư Maneesh Agrawala của Đại học Stanford, nhóm của ông đang nghiêm cứu một thiết bị giúp mọi người lấy lại giọng nói của họ sau khi trải qua phẫu thuật cắt bỏ thanh quản.
Theo đó, nhóm của giáo sư Agrawala sẽ ghi lại giọng nói của một bệnh nhân trước khi phẫu thuật và sau đó sử dụng bản ghi âm giọng nói của bệnh nhân đó để chuyển đổi giọng nói từ máy gắn ở thanh quản của họ thành giọng nói như ban đầu.
Toàn cảnh dự án của nhóm nghiên cứu.