Trung Quốc gây bất ngờ
Bùng nổ AI đến nay vẫn là sự thống trị bởi các công ty Mỹ như OpenAI, Google và Meta. Tuy nhiên, trong những tháng gần đây, một cái tên mới đã xuất hiện: Qwen của Alibaba. Trong vài tháng qua, các biến thể của Qwen đã đứng đầu bảng xếp hạng các trang web đo lường hiệu suất mô hình AI.
"Qwen 72B là vua và các mô hình Trung Quốc đang thống trị", Clem Delangue, CEO của Hugging Face, viết vào tháng 6, sau khi một mô hình dựa trên Qwen lần đầu tiên vươn lên dẫn đầu bảng xếp hạng Open LLM.
Đây là một bước ngoặt gây kinh ngạc đối với ngành công nghiệp AI của Trung Quốc, vốn được nhiều người cho là đã bị hủy hoại bởi hạn chế về bán dẫn cũng như thiếu sức mạnh tính toán.
Thành công của Qwen cho thấy Trung Quốc có thể cạnh tranh với các mô hình AI tốt nhất thế giới, cũng như đặt ra câu hỏi nghiêm túc về việc các công ty Mỹ sẽ tiếp tục thống trị lĩnh vực này trong bao lâu.
Bằng cách tập trung vào các khả năng như hỗ trợ ngôn ngữ, Qwen đang mở ra một hướng đi mới về những gì một mô hình AI có thể làm và có thể xây dựng cho ai.
Những khả năng đó đã gây ngạc nhiên cho nhiều nhà phát triển, ngay cả với những người đang làm việc trên chính Qwen.
Nhà phát triển AI David Ng đã sử dụng Qwen để xây dựng mô hình đứng đầu bảng xếp hạng Open LLM. Ông cũng đã xây dựng các mô hình bằng công nghệ của Meta và Google nhưng cho biết Alibaba mới mang lại kết quả tốt nhất. "Vì một lý do nào đó, mô hình của Trung Quốc lại hoạt động tốt nhất", ông nói với Rest of World. "Tôi không biết tại sao".
Trong ngắn hạn, phần lớn thành công của Qwen đến từ vị thế của công ty trên thị trường Trung Quốc. Khi ra mắt, Alibaba tuyên bố có khoảng 90.000 khách hàng đang sử dụng một số mô hình từ loạt LLM Tongyi Qianwen của Alibaba. (Cái tên "Qwen" xuất phát từ cách viết tắt của thuật ngữ này, có nghĩa là "kiến thức toàn diện").
Hầu hết khách hàng là các công ty Trung Quốc vốn không muốn hợp tác trực tiếp với các công ty Mỹ như OpenAI hoặc Anthropic.
Các công ty trên toàn thế giới đang cố gắng tích hợp AI vào các sản phẩm và dịch vụ của mình và ở Trung Quốc cũng không ngoại lệ. Alibaba tuyên bố Qwen có hơn 2,2 triệu người dùng doanh nghiệp.
Một sản phẩm do Qwen cung cấp cho bộ phận thiết bị di động của Xiaomi cho phép người dùng tạo công thức nấu ăn từ ảnh chụp món ăn. Qwen cũng cung cấp sức mạnh cho trợ lý ảo của Xiaomi, có trên cả điện thoại di động và hệ thống trong xe hơi.
Phải có tài năng nhất định
Xây dựng trên Qwen mang lại cho các công ty Trung Quốc sự ổn định do các công ty AI của Mỹ đã cắt quyền truy cập API cho người dùng Trung Quốc, trong khi nhiều trang web AI bị chặn. Nhưng quan trọng hơn, Qwen không chỉ là một giải pháp thay thế khả dụng mà đang chứng minh rằng nó có khả năng ngang bằng với những thứ đã có ở Mỹ.
Các kỹ sư cũng có thể truy cập mô hình nền tảng của Alibaba từ hầu như mọi nơi trên hành tinh. Sự thông thạo của Qwen trong các ngôn ngữ chính nằm ngoài hầu hết dữ liệu đào tạo AI của thế giới — bao gồm các ngôn ngữ có ít tài nguyên như tiếng Miến Điện, tiếng Bengal và tiếng Urdu — mang lại cho mô hình này lợi thế lớn. Để so sánh, mô hình AI nguồn mở Llama của Meta chỉ bao gồm tiếng Anh.
Một số người trong ngành coi đó là sự mở rộng nguyên tắc chung của Alibaba là xây dựng cho toàn thế giới thay vì chỉ ưu tiên Trung Quốc.
Dylan Patel từ công ty nghiên cứu và phân tích độc lập SemiAnalysis, nói với Rest of World rằng mặc dù Qwen không tốt bằng GPT-4, nhưng nó cũng tiệm cận để gây chú ý.
Hiệu suất của Qwen càng nổi bật khi xét đến các rào cản thương mại của Washington nhằm làm chậm sự phát triển AI của Trung Quốc. Kể từ năm 2022, Mỹ đã chặn xuất khẩu các chip tiên tiến nhất của Nvidia bao gồm các con chip hỗ trợ cho thế hệ mô hình AI mới nhất.
Phần lớn thiết bị cần thiết để sản xuất chip tiên tiến trong nước cũng bị chặn xuất khẩu sang Trung Quốc, vì vậy các công ty công nghệ trong nước như Huawei đã phải vật lộn để lấp đầy khoảng trống.
Khi các công ty AI chạy đua để tạo ra các mô hình ngày càng phức tạp, họ cần số lượng lớn hơn bao giờ hết sức mạnh xử lý, và lệnh cấm vận chip đồng nghĩa với việc các công ty Trung Quốc thiếu hụt nguồn sức mạnh đó.
Các nhà phân tích coi thành công gần đây của AI Trung Quốc là bằng chứng cho thấy những trở ngại trên không hoàn toàn phá hủy ngành công nghiệp này.
"Những mô hình trên ít nhất cũng chứng minh được hệ sinh thái ở Trung Quốc tinh vi đến thế nào", Karman Lucero, thành viên tại Trung tâm Paul Tsai China thuộc Trường Luật Yale, nói với Rest of World. "Họ sẽ không thể làm được nếu không có một trình độ tài năng nhất định".