Trong một động thái nhằm chứng tỏ rằng, mình sẵn sàng chia sẻ các tiến bộ về AI với nhân loại dù đang là người sở hữu chúng, vào tuần trước tỷ phú Elon Musk tuyên bố sẽ mã nguồn mở chatbot AI Grok của mình. Và giờ đây lời hứa đã trở thành sự thật.
Tối qua, một bài đăng trên blog của xAI – công ty trí tuệ nhân tạo do ông Musk sáng lập –cho biết toàn bộ phần code của mô hình ngôn ngữ lớn Grok-1, nền tảng AI bên dưới chatbot Grok, đã được upload lên GitHub tại đường link: https://github.com/xai-org/grok-1, để mọi người có thể truy cập vào nó.
Bài đăng của xAI cho biết, phần mã nguồn mở này bao gồm "khối lượng cơ bản và kiến trúc mạng lưới" của Grok-1, mô hình thiết kế theo kỹ thuật "Mixture-of-Experts" với 314 tỷ tham số. Bài đăng cũng cho biết, dữ liệu huấn luyện của mô hình có điểm mốc vào tháng 10 năm ngoái và chưa trải qua quá trình tinh chỉnh "cho bất kỳ ứng dụng cụ thể nào, ví dụ như đối thoại."
Với 314 tỷ tham số, mô hình Grok-1 có kích thước lớn gần gấp đôi kích thước của GPT-3, mô hình ngôn ngữ lớn từng được dùng để vận hành ChatGPT trước đây – và cũng là mô hình AI mã nguồn mở lớn nhất hiện nay.
Điều đáng nói là riêng việc vận hành được GPT-3 đã cần đến 700GB bộ nhớ VRAM của các GPU. Với kích thước của Grok-1 lớn gần gấp đôi GPT-3, các yêu cầu về phần cứng chắc chắn sẽ còn lớn hơn nhiều nữa. Do vậy, nếu muốn vận hành được mô hình AI này, các doanh nghiệp phải đầu tư không nhỏ về phần cứng AI, hoặc tìm đến các dịch vụ đám mây như Azure của Microsoft.
Được phát hành theo giấy phép Apache 2.0, nghĩa là mô hình mã nguồn mở này cho phép sử dụng với mục đích thương mại nhưng không bao gồm dữ liệu được sử dụng để huấn luyện nó cũng như khả năng kết nối với nền tảng X.com để truy cập dữ liệu theo thời gian thực. Trước đó, trong một bài đăng vào tháng 11 năm 2023, xAI cho biét Grok được phát triển để hỗ trợ người dùng trong khả năng sản sinh các dòng code, các bài viết sáng tạo và trả lời câu hỏi.
Trên thế giới cũng có nhiều mô hình ngôn ngữ lớn được mã nguồn mở - một phần hoặc toàn bộ - để nhận được phản hồi từ các nhà nghiên cứu khác về cách cải thiện nó. Cho dù có một số mô hình AI được mã nguồn mở hoàn toàn như Mistral và Falcon, đa số các mô hình được biết đến nhiều nhất lại là những mô hình chỉ được mở một phần hoặc đóng hoàn toàn. Ví dụ mô hình Llama 2 của Meta được cung cấp miễn phí nhưng đối với khách hàng có trên 700 triệu lượt người dùng hàng ngày sẽ phải trả phí.
Trước đó, để truy cập được chatbot Grok, người dùng phải đăng ký thuê bao trên nền tảng X (Twitter) trước đây. Mục tiêu là biến Grok trở thành đối thủ cạnh tranh với các chatbot khác như ChatGPT hay Gemini. Nó được huấn luyện để đưa ra các câu trả lời theo thiên hướng mỉa mai, hài hước hơn là các câu nói nghiêm túc – tuy nhiên các thử nghiệm ban đầu cho thấy nó chưa đáp ứng được kỳ vọng của người dùng cũng như cho thấy khả năng thay thế các đối thủ khác.
Đối với ông Musk, việc mã nguồn mở mô hình Grok-1 còn có nhiều ý nghĩa hơn chỉ là một động thái kỹ thuật thuần túy. Hiện tại tỷ phú này đang trong quá trình khởi kiện OpenAI khi chỉ trích công ty này đã từ bỏ "thỏa thuận sáng lập" của mình về việc hoạt động phi lợi nhuận và yêu cầu công ty này quay trở lại thành một tổ chức mã nguồn mở, bao gồm cả các công cụ AI hiện tại.
Tuy nhiên không lâu sau đó, OpenAI đã phản pháo với các email trao đổi trước đây cho thấy, ông Musk muốn sáp nhập OpenAI với hãng xe Tesla và để ông Musk nắm quyền kiểm soát hoàn toàn cho các công cụ AI mà tổ chức này phát triển được vào thời điểm đó. Do vậy, việc ông Musk mã nguồn mở mô hình Grok-1 sẽ không chỉ là lời chỉ trích nhắm tới OpenAI mà còn giúp mang lại một vị thế mạnh mẽ hơn cho các lập luận của ông Musk trong đơn kiện.