Trước khi biết về công nghệ AI mới của Google, bạn hãy nghe kết quả dự án nghiên cứu trước.
Đây là một câu trong tiếng Tây Ban Nha.
Vẫn là câu đó, được dịch sang tiếng Anh bằng hệ thống thông thường của Google. Các hệ thống dịch thuật khác cũng sẽ có kết quả tương tự, chỉ là giọng khác nhau thôi.
Dịch sang tiếng Anh, câu này có nghĩa là: “Tôi tự hỏi mình cảm thấy sao, và đó là lúc tôi bắt đầu khóc”.
Đây là câu nói nguyên bản được dịch sang tiếng Anh, thông qua hệ thống dịch tự động mới. Nội dung câu nói giờ đã khác: "Larry hỏi tôi cảm thấy thế nào, và đó là lúc tôi bắt đầu khóc".
Kết quả chưa hoàn hảo, nhưng bạn có thể thấy ngữ điệu, âm sắc trầm bổng trong câu nói được giữ lại phần nhiều. Đây là hệ thống dịch lập tức mới của Google, có thể cho phép người dùng giữ lại chính giọng nói đó.
Đây chính là điểm khác biệt giữa hai hệ thống dịch thuật giọng nói cũ và mới. Trước thời điểm này, mọi câu nói đều được chuyển hóa thành dạng text, được dịch lại thành ngôn ngữ yêu cầu và được đọc lại bằng giọng nói máy móc. Việc này khiến cho ngữ điệu bị mất trong quá trình phiên dịch.
Hệ thống mới, được đặt cho cái tên Translatotron, bao gồm 3 thành phần; cả ba sẽ đều tập trung vào ảnh phổ - hình ảnh đại diện cho một phổ nhất định, rồi thực hiện ba công việc khác nhau.
Phần đầu tiên sẽ sử dụng mạng neural đã được huấn luyện phân tích phổ âm thanh, để tạo ra một phổ âm thanh của ngôn ngữ đầu ra.
Phần thứ hai sẽ chuyển phổ đó thành một sóng âm thanh có thể nghe được.
Phần thứ ba sẽ tách riêng những nét đặc trưng trong giọng nói nguyên bản, để gắn vào đoạn âm thanh cuối cùng.
Cách thức mới không chỉ giữ nguyên được những ngữ điệu (trong nhiều trường hợp là cả hàm ý) người nói trong sản phẩm cuối cùng, trên lyus thuyết, nó còn giảm được lỗi khi cắt bớt được những bước không cần thiết trong các hệ thống dịch thuật cũ.
Translatotron mới chỉ là sản phẩm mẫu mang tính chất chứng minh hệ thống hoạt động được. Trong quá trình thử, các nhà nghiên cứu mới chỉ tập trung vào dịch tiếng Tây Ban Nha sang tiếng Anh, “mới chỉ” có thế mà đã cần tới lượng dữ liệu huấn luyện AI khổng lồ. Nhưng nó hé cánh cửa hẹp cho ta thấy tương lai có thể sẽ ra sao.