Phát minh này, lần đầu xuất hiện trên thế giới, được hy vọng sẽ có khả năng thay đổi cuộc sống của những người mất khả năng nói do bị đột quỵ, hoặc các căn bệnh như bệnh xơ cứng teo cơ một bên.
Từ trước đến nay, bệnh nhân phải dựa vào các công cụ tổng hợp giọng nói chậm chạp, hoạt động bằng cách đánh vần từng từ một dựa vào chuyển động mắt hoặc cử động nhỏ trên khuôn mặt, khiến những cuộc trò chuyện tự nhiên trở thành điều bất khả thi.
Công nghệ mới nhất sử dụng các điện cực cực nhỏ được cấy trên bề mặt não, nhằm phát hiện hoạt động trong phần não điều khiển lời nói và cử động khuôn mặt. Những tín hiệu này được dịch trực tiếp thành lời nói và nét mặt của hình đại diện trên màn hình, bao gồm mỉm cười, cau mày hoặc ngạc nhiên.
Người bị liệt có thể nói chuyện nhờ công nghệ dịch tín hiệu não
“Mục tiêu của chúng tôi là khôi phục khả năng giao tiếp đầy đủ, cụ thể, điều tự nhiên nhất mỗi khi chúng ta nói chuyện với người khác. Những tiến bộ này rất có thể trở thành một giải pháp thực tế cho các bệnh nhân”, giáo sư Edward Chang, người dẫn đầu nghiên cứu tại Đại học California (USCF) ở Mỹ cho biết.
Bệnh nhân Ann, 47 tuổi, bị liệt nặng do bị đột quỵ vùng thân não hơn 18 năm trước. Bà không thể nói hoặc gõ bàn phím và thường giao tiếp bằng công nghệ theo dõi chuyển động mắt với tốc độ tối đa chỉ 14 từ một phút. Bà Ann hy vọng công nghệ mới này có thể giúp bà trở thành một cố vấn trong tương lai.
Bà Ann nói chuyện thông qua hình đại diện kỹ thuật số
Nhóm nghiên cứu đã cấy một hình chữ nhật mỏng, bao gồm 253 điện cực lên bề mặt não của bà Ann, trên vùng phụ trách khả năng nói. Các điện cực sẽ xử lý các tín hiệu từ não vốn dùng để điều khiển các cơ ở lưỡi, hàm, thanh quản và mặt của bà.
Sau khi cấy ghép thành công, bà Ann đã làm việc với nhóm nghiên cứu để đào tạo thuật toán AI của hệ thống, bằng cách lặp đi lặp lại các cụm từ, để nó có thể liên hệ các tín hiệu não bà với các âm thanh lời nói khác nhau.
Máy tính đã học được 39 âm thanh và một mô hình ngôn ngữ giống Chat GPT được sử dụng để dịch các tín hiệu thành những câu nói dễ hiểu. Sau đó, một hình đại diện sẽ truyền đạt thông điệp với giọng nói được dựng lại theo giọng của bà Ann trước khi bà bị chấn thương.
Công nghệ này hiện vẫn chưa hoàn hảo. Trong một cuộc thử nghiệm liên quan đến hơn 500 cụm từ, tỷ lệ giải mã chính xác các từ chỉ là 72% và tốc độ chuyển đổi từ tín hiệu não ra văn bản là 78 từ một phút, so với 110-150 từ thường được nói trong một cuộc trò chuyện tự nhiên.
Tuy nhiên, các nhà khoa học tin rằng những tiến bộ mới nhất về độ chính xác, tốc độ và độ phức tạp cho thấy công nghệ này đang ngày càng trở nên hữu ích cho các bệnh nhân. “Đây là một bước nhảy vọt so với các kết quả trước đó. Chúng ta đang ở điểm bùng phát”, giáo sư Nick Ramsey, nhà thần kinh học tại Đại học Utrecht (Hà Lan) cho biết.
Bước quan trọng tiếp theo là tạo ra một phiên bản không dây có thể được cấy bên dưới hộp sọ. “Việc mang lại cho mọi người khả năng tự do điều khiển máy tính và điện thoại của họ bằng công nghệ này sẽ có tác động sâu sắc đến tính độc lập và các mối quan hệ xã hội của họ”, tiến sĩ David Moses, giáo sư về phẫu thuật thần kinh tại UCSF và đồng tác giả của nghiên cứu nói.