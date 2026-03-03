Nvidia tham vọng "đổi ngôi" thị trường điện toán với dòng chip xử lý AI mới

Nvidia đang lên kế hoạch ra mắt một bộ vi xử lý mới được thiết kế riêng biệt nhằm hỗ trợ OpenAI và các khách hàng khác xây dựng những công cụ nhanh và hiệu quả hơn. Bước đi này được kỳ vọng sẽ tạo ra một cuộc chuyển mình lớn trong hoạt động kinh doanh của hãng, đồng thời tái thiết lập cục diện cuộc đua trí tuệ nhân tạo (AI).

Theo các nguồn tin thân cận, gã khổng lồ chip đang thiết kế một hệ thống mới phục vụ cho "điện toán suy luận" – một dạng xử lý cho phép các mô hình AI phản hồi truy vấn của người dùng. Nền tảng mới này dự kiến sẽ được trình làng tại Hội nghị phát triển GTC của Nvidia tại San Jose vào tháng tới. Đáng chú ý, hệ thống này sẽ tích hợp một loại chip do startup Groq thiết kế.

Mảng điện toán suy luận hiện đang là tâm điểm cạnh tranh gay gắt trong ngành. Các đối thủ như Google và Amazon đã tự thiết kế các dòng chip riêng để đối đầu trực tiếp với các hệ thống chủ lực của Nvidia. Bên cạnh đó, sự bùng nổ của việc lập trình tự động trong lực lượng lao động công nghệ đã thúc đẩy nhu cầu về các loại chip mới có khả năng xử lý các tác vụ phức tạp liên quan đến AI một cách hiệu quả hơn.

Việc OpenAI đồng ý trở thành một trong những khách hàng lớn nhất sử dụng bộ vi xử lý mới này được xem là thắng lợi quan trọng đối với Nvidia. Cha đẻ của ChatGPT – vốn là một trong những khách hàng lớn nhất của Nvidia – đã dành nhiều tháng qua để tìm kiếm các giải pháp thay thế hiệu quả hơn cho chip của Nvidia và thậm chí đã ký thỏa thuận với một startup chip khác vào tháng trước để mở rộng các lựa chọn của mình.

Trước đó, OpenAI cũng đã ẩn ý về bộ vi xử lý mới khi thông báo sẽ ký kết một hợp đồng mua sắm lớn về "năng lực suy luận chuyên dụng" từ Nvidia, đi kèm với khoản đầu tư 30 tỷ USD từ gã khổng lồ ngành chip này. Đồng thời, OpenAI cũng đã ký một thỏa thuận mới quan trọng để sử dụng chip Trainium của Amazon.

Vượt qua giới hạn

Từ trước đến nay, Nvidia luôn thống trị lĩnh vực thiết kế và kinh doanh GPU (đơn vị xử lý đồ họa) – loại chip có khả năng thực hiện hàng tỷ tác vụ đơn giản cùng lúc. Tuy nhiên, lần đầu tiên kể từ khi cơn sốt AI bùng nổ, hãng đang phải đối mặt với những giới hạn từ sản phẩm chủ lực của chính mình. Khi thị trường chuyển dịch trọng tâm sang mảng suy luận, Nvidia đang chịu áp lực lớn từ phía khách hàng trong việc sản xuất các loại chip có khả năng vận hành các ứng dụng AI hiệu quả hơn.

Các dòng GPU mạnh mẽ của hãng như Hopper, Blackwell và Rubin vẫn được coi là "tiêu chuẩn vàng" để huấn luyện các mô hình AI khổng lồ và luôn có mức giá đắt đỏ. Hầu hết các nhà phân tích ước tính Nvidia đang nắm giữ từ 90% thị phần GPU trở lên.

CEO Nvidia, ông Jensen Huang, từ lâu đã khẳng định rằng GPU của hãng dẫn đầu thị trường ở cả mảng huấn luyện lẫn suy luận, và sự đa năng đó chính là điểm hấp dẫn cốt lõi của sản phẩm.

Tuy nhiên, trong năm qua, nhu cầu về điện toán cao cấp đã dịch chuyển từ huấn luyện sang suy luận khi các doanh nghiệp bắt đầu triển khai các "tác nhân AI" (AI agents) và các công cụ khác. Họ kỳ vọng những công cụ này sẽ thay đổi diện mạo của hàng trăm ngành công nghiệp và tạo ra lợi nhuận khổng lồ từ phí thuê bao. Các "tác nhân" này là những hệ thống AI hoạt động tương đối tự chủ để thực hiện các nhiệm vụ thay mặt cho người dùng.

Nhiều công ty xây dựng và vận hành các tác nhân AI nhận thấy rằng GPU quá tốn kém, tiêu thụ quá nhiều năng lượng và không thực sự tối ưu để vận hành thực tế các mô hình của họ. Với sự trỗi dậy mạnh mẽ của "AI tác nhân" (agentic AI), Nvidia đang đứng trước sức ép phải phát triển các dòng chip suy luận có chi phí thấp hơn và tiết kiệm điện năng hơn.

Giải pháp của Nvidia

Tháng trước, OpenAI đã ký kết đối tác điện toán trị giá nhiều tỷ USD với Cerebras – đơn vị cung cấp dòng chip chuyên dụng cho suy luận mà CEO Andrew Feldman khẳng định là nhanh hơn cả GPU của Nvidia. Tờ The Journal trước đó đưa tin, OpenAI đã đàm phán với Cerebras từ mùa thu năm ngoái sau khi các kỹ sư của hãng yêu cầu một loại chip suy luận nhanh hơn cho các ứng dụng lập trình bằng tác nhân AI.

Vào cuối năm ngoái, Nvidia đã đồng ý chi 20 tỷ USD để mua bản quyền các công nghệ then chốt từ Groq và chiêu mộ đội ngũ lãnh đạo cấp cao của startup này, bao gồm cả người sáng lập Jonathan Ross. Theo The Wall Street Journal , đây là một trong những thương vụ thâu tóm nhân tài lớn nhất lịch sử Thung lũng Silicon.

Groq đã thiết kế các loại chip sử dụng kiến trúc khác biệt hoàn toàn với Nvidia, được gọi là "đơn vị xử lý ngôn ngữ" (LPUs), vốn cực kỳ hiệu quả cho các chức năng suy luận. Dù vậy, cho đến nay Nvidia vẫn giữ kín kế hoạch về việc sẽ sử dụng công nghệ của Groq như thế nào.

Quá trình điện toán suy luận AI được chia thành hai tác vụ chính: pre-fill (quá trình mô hình diễn giải câu lệnh của người dùng) và decode (quá trình mô hình tạo ra phản hồi theo từng từ một). Thông thường, pre-fill là quy trình nhanh hơn, trong khi decode có xu hướng đặc biệt chậm đối với các mô hình AI lớn.

Các ứng dụng lập trình đã trở thành một trong những mục đích sử dụng quan trọng và mang lại lợi nhuận cao nhất của AI doanh nghiệp, trong đó Claude Code của Anthropic thường được coi là cái tên dẫn đầu thị trường. Tuy nhiên, Anthropic chủ yếu dựa vào chip do Amazon Web Services và Google Cloud thiết kế thay vì sử dụng sản phẩm của Nvidia để vận hành các mô hình của mình.

Dù vậy, một trong những đối thủ đáng gờm nhất của Claude chính là công cụ Codex đang tăng trưởng nhanh chóng của OpenAI. Các nguồn tin thân cận cho biết, OpenAI dự định sử dụng hệ thống mới của Nvidia để nâng cấp và cải thiện Codex.

Thông thường, Nvidia kết hợp chip Vera (đơn vị xử lý trung tâm - CPU) với GPU Rubin trong các máy chủ trung tâm dữ liệu mạnh mẽ. Tuy nhiên, một số khách hàng lớn nhận thấy rằng một số khối lượng công việc của AI tác nhân có thể vận hành hiệu quả hơn chỉ với CPU.

Tháng này, Nvidia đã công bố mở rộng quan hệ đối tác với Meta Platforms, bao gồm việc lần đầu tiên triển khai hệ thống chỉ sử dụng CPU trên quy mô lớn để hỗ trợ các tác nhân AI nhắm mục tiêu quảng cáo của Meta. Thỏa thuận này đã hé mở cái nhìn sớm về chiến lược của Nvidia: nhìn xa hơn GPU để thâu tóm mọi ngóc ngách của thị trường AI.