Cho đến thời điểm hiện tại, cơn sốt AI vẫn được thống trị bởi các công ty Mỹ như OpenAI, Google và Meta. Tuy nhiên, trong những tháng gần đây, một cái tên mới đã xuất hiện: Qwen của Alibaba.
“Qwen 72B là vua và các mô hình của Trung Quốc đang thống trị", Clem Delangue, CEO của Hugging Face đã viết vào tháng 6, sau khi một mô hình dựa trên Qwen lần đầu tiên vươn lên dẫn đầu bảng xếp hạng LLM mở của công ty ông.
Đây là một bước ngoặt đáng ngạc nhiên đối với ngành công nghiệp AI của Trung Quốc, vốn được nhiều người cho là đã bị ảnh hưởng bởi các hạn chế về chất bán dẫn và sức mạnh tính toán. Thành công của Qwen cho thấy Trung Quốc có thể cạnh tranh với các mô hình AI tốt nhất thế giới, đồng thời đặt ra câu hỏi nghiêm túc về khả năng tiếp tục thống trị của các công ty Mỹ. Bằng cách tập trung vào các khả năng như hỗ trợ ngôn ngữ, Qwen đang mở ra hướng đi mới về những gì một mô hình AI có thể làm.
Điều này gây bất ngờ cho nhiều nhà phát triển, ngay cả những người đang làm việc trên chính Qwen. Nhà phát triển AI David Ng đã sử dụng Qwen để xây dựng mô hình đứng đầu bảng xếp hạng Open LLM. Ông cũng đã xây dựng các mô hình bằng công nghệ của Meta và Google nhưng cho biết Alibaba mang lại cho mình kết quả tốt đáng kinh ngạc. “Vì một lý do nào đó, nó hoạt động tốt nhất trên các mô hình của Trung Quốc”, ông nói với Rest of World. “Tôi không biết tại sao”.
Trong ngắn hạn, phần lớn thành công của Qwen đến từ vị thế độc đáo của nó trên thị trường Trung Quốc. Khi ra mắt, Alibaba tuyên bố rằng có khoảng 90.000 khách hàng đang sử dụng một số mô hình từ loạt LLM Tongyi Qianwen của Alibaba. (Tên "Qwen" bắt nguồn từ cách viết tắt của thuật ngữ này, có nghĩa là "kiến thức toàn diện").
Hầu hết khách hàng là các công ty Trung Quốc. Những công ty này không muốn hình thành quan hệ đối tác trực tiếp với các công ty Mỹ như OpenAI hoặc Anthropic.
Các công ty trên khắp thế giới đang cố gắng tích hợp AI vào sản phẩm và dịch vụ của mình và Trung Quốc không ngoại lệ. Alibaba tuyên bố Qwen đã có hơn 2,2 triệu người dùng doanh nghiệp; hầu hết các quan hệ đối tác công khai vẫn đang trong giai đoạn thử nghiệm. Một sản phẩm do Qwen cung cấp cho bộ phận thiết bị di động của Xiaomi cho phép người dùng tạo công thức nấu ăn từ ảnh chụp món ăn. Qwen cũng hỗ trợ trợ lý di động của Xiaomi, trên cả điện thoại di động và hệ thống xe hơi.
Xây dựng trên Qwen mang lại cho các công ty Trung Quốc sự ổn định. Các công ty AI của Mỹ đã cắt quyền truy cập API của người dùng Trung Quốc, trong khi nhiều trang web AI bị chặn. Tuy nhiên, quan trọng hơn, Qwen không chỉ là một giải pháp thay thế khả dụng. Nó đã chứng tỏ được khả năng của mình tương đương những gì đang sẵn có tại Mỹ.
Các kỹ sư có thể truy cập mô hình nền tảng của Alibaba từ hầu hết mọi nơi. Sự thông thạo của Qwen trong các ngôn ngữ chính nằm ngoài hầu hết dữ liệu đào tạo AI và đây là một lợi thế lớn. Một số coi đây là sự mở rộng nguyên tắc chung của Alibaba: xây dựng cho toàn cầu thay vì ưu tiên Trung Quốc.
“Tôi tin rằng chiến lược của Qwen cho thấy sứ mệnh ban đầu của Alibaba là làm cho việc kinh doanh trở nên dễ dàng, ở bất cứ đâu”, Tiezhen Wang, một kỹ sư tại Hugging Face, nói với Rest of World và cho biết mô hình có tiềm năng cách mạng hóa giao tiếp kinh doanh toàn cầu bằng cách vượt qua ranh giới ngôn ngữ, thậm chí là văn hóa.
Dylan Patel, của công ty nghiên cứu và phân tích độc lập SemiAnalysis, nói với Rest of World rằng mặc dù Qwen không tốt bằng GPT-4, nhưng đủ để gây sự chú ý.
Patel cho biết mô hình của Alibaba thường vượt trội hơn các đối thủ trong các lĩnh vực như toán học và hoạt động đa ngôn ngữ.
Hiệu suất của Qwen đáng chú ý khi xét đến các rào cản thương mại đáng kể của Mỹ nhằm làm chậm sự phát triển AI của Trung Quốc. Kể từ năm 2022, Mỹ chặn xuất khẩu các chip tiên tiến nhất. Phần lớn thiết bị cần thiết để sản xuất chip tiên tiến trong nước cũng bị chặn xuất khẩu sang Trung Quốc, vậy nên các công ty công nghệ trong nước như Huawei đã phải vật lộn để lấp đầy khoảng trống. Khi các công ty AI chạy đua tạo ra các mô hình ngày càng phức tạp, họ cần số lượng lớn hơn bao giờ hết sức mạnh xử lý.
Thành công gần đây của AI Trung Quốc chính là bằng chứng cho thấy lệnh cấm vận không hoàn toàn có thể phá hủy ngành công nghiệp này.
“Chúng ít nhất cũng chứng minh được hệ sinh thái ở Trung Quốc tinh vi như thế nào”, Karman Lucero, một thành viên tại Trung tâm Paul Tsai China thuộc Trường Luật Yale, nói với Rest of World. “Họ sẽ không thể làm được điều này nếu thiếu trình độ và tài năng nhất định”.
Được biết, 18 tháng kể từ khi OpenAI ra mắt ChatGPT, các công ty công nghệ lớn và nhỏ của Trung Quốc đã tập hợp lại vì một mục tiêu duy nhất: đánh bại công ty khởi nghiệp có trụ sở tại San Francisco bằng các chatbot tiếng Trung. Với hơn 200 mô hình ngôn ngữ lớn (LLM), Trung Quốc tự tin rằng giá cả chính là lợi thế mà Mỹ không thể chối cãi.
ByteDance, Baidu, Alibaba và Tencent đồng loạt giảm giá mạnh các dịch vụ LLM, trong đó một số cung cấp cả những loại dịch vụ miễn phí. Ưu đãi cao cấp từ Doubao Pro của ByteDance có giá thấp nhất chỉ 0,0008 nhân dân tệ (0,011 xu Mỹ) cho 1.000 token prompt - đơn vị cơ bản mà các mô hình máy tính sử dụng để tính độ dài của một văn bản.
Xu Li, CEO và đồng sáng lập của công ty AI SenseTime niêm yết ở Hồng Kông, nói với South China Morning Post: “Việc giảm giá dịch vụ AI của Trung Quốc chủ yếu nhằm mục đích thu hút nhiều khách hàng hơn. Nó giống như một cách xây dựng thương hiệu”.
Theo Alain Le Couedic, đối tác cấp cao tại công ty đầu tư AI Trí tuệ nhân tạo Quartermaster (AIQ), cuộc cạnh tranh về giá sẽ mang lại kết quả theo thời gian. “Cuộc đua giành quyền thống trị trên thị trường là dấu hiệu cho thấy nhiều người chơi đang nhìn ra được những cơ hội hấp dẫn trong tương lai, ngay cả khi chúng có thể gây ra khó khăn nhất định trong ngắn hạn và trung hạn”.
"Thị trường Trung Quốc đặc biệt mong muốn thiết lập các liên kết nhanh chóng giữa các ứng dụng AI và tận dụng kinh doanh để thúc đẩy những tiến bộ hơn nữa trong LLM", Ivan Lam, nhà phân tích tại công ty tư vấn thị trường Counterpoint Research, cho biết.
Theo: Rest of World, SCMP