Sự xuất hiện của siêu GPU H100 năm 2023 của Nvidia đã biến "gã khổng lồ công nghệ" Mỹ thành một tập đoàn trị giá hàng nghìn tỷ đô la Mỹ. Chỉ riêng GPU H100 đã khiến các đối thủ cạnh tranh của Nvidia phải vật lộn để bắt kịp.
Siêu GPU H100 chính là sản phẩm mà Nvidia vừa mang đến Việt Nam sau khi "gã khổng lồ công nghệ Mỹ" này ký kết hợp tác với Chính phủ Việt Nam chiều ngày 5/12/2024, trong việc thành lập 2 trung tâm AI của Nvidia tại Việt Nam [cụ thể là Trung tâm Nghiên cứu và Phát triển Trí tuệ nhân tạo (R&D AI); và Trung tâm Dữ liệu AI].
Cho đến nay, Nvidia mới chỉ đặt trung tâm R&D AI ở 3 nơi trên thế giới đó là Thung lũng Silicon (Mỹ); Đài Loan (Trung Quốc) - quê hương ông; và giờ đây là Việt Nam - nơi ông gọi là "quê hương thứ hai" của mình.
Forbes nhận định, Nvidia đang vững vàng đi đầu trong sự phát triển tiếp theo trong lĩnh vực điện toán khi họ chưa bao giờ ngừng sáng tạo, nghiên cứu và trình làng những nền tảng mới, giúp tăng tốc tính toán, đồng thời khiến các đối thủ bị bỏ xa.
Nvidia Blackwell: Mở ra kỷ nguyên mới cho điện toán
Thời điểm nửa cuối tháng 3/2024 đến đánh dấu khả năng nới rộng khoảng cách dẫn đầu của gã khổng lồ công nghệ Nvidia — với Nvidia Blackwell Platform (Nền tảng Blackwell của Nvidia).
The Verge bình luận, sự xuất hiện của Blackwell đã mở ra kỷ nguyên mới cho điện toán, cho phép các tổ chức ở khắp mọi nơi xây dựng và chạy AI tạo sinh theo thời gian thực trên các mô hình ngôn ngữ lớn có hàng nghìn tỷ tham số với chi phí và mức tiêu thụ năng lượng ít hơn tới 25 lần so với nền tảng tiền nhiệm.
Nền tảng Blackwell của Nvidia có 6 công nghệ mang tính chuyển đổi để tăng tốc tính toán, giúp mở ra những đột phá trong xử lý dữ liệu, mô phỏng kỹ thuật, tự động hóa thiết kế điện tử, thiết kế thuốc hỗ trợ máy tính, điện toán lượng tử và AI tạo sinh.
“Trong ba thập kỷ, chúng tôi đã theo đuổi điện toán tăng tốc, với mục tiêu tạo ra những đột phá mang tính chuyển đổi như học sâu và AI”, Jensen Huang, nhà sáng lập kiêm Giám đốc điều hành của NVIDIA cho biết. “AI tạo sinh là công nghệ định hình thời đại của chúng ta. Blackwell là động lực thúc đẩy cuộc cách mạng công nghiệp mới này. Khi hợp tác với những công ty năng động nhất trên thế giới, chúng tôi sẽ hiện thực hóa lời hứa về AI cho mọi ngành công nghiệp”.
Blackwell Platform được đặt tên để vinh danh David Harold Blackwell — một nhà toán học chuyên về lý thuyết trò chơi và thống kê, đồng thời là học giả da đen đầu tiên được bầu vào Viện Hàn lâm Khoa học Quốc gia Mỹ — nền tảng mới này kế thừa kiến trúc Nvidia Hopper, ra mắt cách đây 2 năm.
6 công nghệ đột phá của nền tảng Blackwell
"Gã khổng lồ công nghệ" Nvidia cho biết, 6 công nghệ mang tính cách mạng của Nền tảng Blackwell, cùng nhau cho phép đào tạo AI và suy luận mô hình ngôn ngữ lớn (LLM) thời gian thực cho các mô hình có khả năng mở rộng lên tới 10 nghìn tỷ tham số, bao gồm:
(1) Chip mạnh nhất thế giới: Siêu chip GB200 Grace Blackwell. Được trang bị 208 tỷ bóng bán dẫn, GB200 Grace Blackwell mới cung cấp sức mạnh xử lý FP4 lên tới 20 petaflop.
Siêu chip GB200 Grace Blackwell kết nối 2 Nvidia GPU B200 Tensor Core với Nvidia CPU Grace thông qua kết nối chip-to-chip NVLink công suất cực thấp 900GB/giây.
Siêu chip GB200 này là thành phần chính của Nvidia GB200 NVL72 - một hệ thống rack-scale, làm mát bằng chất lỏng, nhiều nút dành cho khối lượng công việc tính toán chuyên sâu nhất. Nó kết hợp 36 Grace Blackwell Superchip, bao gồm 72 GPU Blackwell và 36 CPU Grace được kết nối với nhau bằng NVLink thế hệ thứ năm.
Nhờ đó, Nvidia GB200 NVL72 cung cấp hiệu suất tăng lên đến 30 lần so với cùng số lượng Nvidia GPU H100 Tensor Core cho khối lượng công việc suy luận LLM và giảm chi phí cũng như mức tiêu thụ năng lượng lên đến 25 lần.
(2) Transformer Engine thế hệ thứ hai — Được hỗ trợ bởi khả năng mở rộng micro-tensor mới và các thuật toán quản lý dải động tiên tiến của Nvidia được tích hợp vào các nền tảng Nvidia TensorRT™-LLM và NeMo Megatron, Blackwell sẽ hỗ trợ gấp đôi kích thước tính toán và mô hình với khả năng suy luận AI dấu phẩy động 4 bit mới.
Trong khi thế hệ đầu tiên sử dụng 8 bit để xử lý mỗi nơ-ron trong mạng nơ-ron, phiên bản mới chỉ sử dụng 4 bit, có khả năng tăng gấp đôi băng thông tính toán.
(3) NVLink thế hệ thứ năm — Để tăng tốc hiệu suất cho các mô hình AI có nhiều nghìn tỷ tham số và kết hợp nhiều chuyên gia, phiên bản mới nhất của Nvidia NVLink® cung cấp thông lượng hai chiều đột phá 1,8TB/giây cho mỗi GPU.
(4) RAS Engine — GPU chạy bằng Blackwell bao gồm một engine chuyên dụng cho độ tin cậy, tính khả dụng và khả năng bảo dưỡng cao. Ngoài ra, kiến trúc Blackwell bổ sung các khả năng ở cấp độ chip để sử dụng bảo trì phòng ngừa dựa trên AI để chạy chẩn đoán và dự báo các vấn đề về độ tin cậy.
Điều này tối đa hóa thời gian hoạt động của hệ thống và cải thiện khả năng phục hồi cho các triển khai AI quy mô lớn để chạy liên tục trong nhiều tuần hoặc thậm chí nhiều tháng và giảm chi phí vận hành.
(5) AI an toàn — Khả năng tính toán bảo mật tiên tiến bảo vệ các mô hình AI và dữ liệu khách hàng mà không ảnh hưởng đến hiệu suất, với sự hỗ trợ cho các giao thức mã hóa giao diện gốc mới. Điều này rất quan trọng đối với các ngành nhạy cảm về quyền riêng tư như chăm sóc sức khỏe và dịch vụ tài chính.
(6) Công cụ giải nén — Một công cụ giải nén chuyên dụng hỗ trợ các định dạng mới nhất, tăng tốc các truy vấn cơ sở dữ liệu để mang lại hiệu suất cao nhất trong phân tích dữ liệu và khoa học dữ liệu.
Trong những năm tới, việc xử lý dữ liệu, mà các công ty chi hàng chục tỷ đô la mỗi năm, sẽ ngày càng được tăng tốc bằng GPU.
Những 'gã khổng lồ' sử dụng Blackwell
Nvidia News cho biết, trong số nhiều công ty/tổ chức áp dụng Nền tảng Blackwell của Nvidia phải kể đến Amazon Web Services, Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla và xAI...
Hãy xem những người đứng đầu các 'gã khổng lồ' khác của Mỹ nói gì về Blackwell.
Elon Musk, CEO của Tesla và xAI: “Hiện tại không có phần cứng nào tốt hơn phần cứng của Nvidia cho AI.”
Sundar Pichai, Tổng giám đốc điều hành của Alphabet và Google: “Việc mở rộng các dịch vụ như Tìm kiếm và Gmail cho hàng tỷ người dùng đã dạy chúng tôi rất nhiều về việc quản lý cơ sở hạ tầng điện toán. Khi chúng tôi bước vào sự thay đổi nền tảng AI, chúng tôi tiếp tục đầu tư sâu vào cơ sở hạ tầng cho các sản phẩm và dịch vụ của riêng mình và cho khách hàng dùng Đám mây của chúng tôi. Chúng tôi rất may mắn khi có mối quan hệ đối tác lâu dài với Nvidia và mong muốn mang các khả năng đột phá của Blackwell đến với khách hàng dùng Đám mây và các nhóm của chúng tôi trên khắp Google, bao gồm cả Google DeepMind, để đẩy nhanh các khám phá trong tương lai”.
Michael Dell, nhà sáng lập kiêm giám đốc điều hành của Dell Technologies: “AI tạo sinh đóng vai trò quan trọng trong việc tạo ra các hệ thống thông minh hơn, đáng tin cậy hơn và hiệu quả hơn. Dell Technologies và Nvidia đang hợp tác để định hình tương lai của công nghệ. Với việc ra mắt Blackwell, chúng tôi sẽ tiếp tục cung cấp các sản phẩm và dịch vụ tăng tốc thế hệ tiếp theo cho khách hàng, cung cấp cho họ các công cụ cần thiết để thúc đẩy sự đổi mới trong các ngành công nghiệp.”
Demis Hassabis, đồng sáng lập kiêm Giám đốc điều hành của Google DeepMind: “Tiềm năng biến đổi của AI là vô cùng to lớn và nó sẽ giúp chúng ta giải quyết một số vấn đề khoa học quan trọng nhất thế giới. Khả năng công nghệ đột phá của Blackwell sẽ cung cấp khả năng tính toán quan trọng cần thiết để giúp những bộ óc thông minh nhất thế giới lập biểu đồ cho những khám phá khoa học mới.”
Mark Zuckerberg, nhà sáng lập kiêm giám đốc điều hành của Meta: “AI đã cung cấp năng lượng cho mọi thứ, từ các mô hình ngôn ngữ lớn đến các đề xuất nội dung, quảng cáo và hệ thống an toàn của chúng tôi, và nó sẽ ngày càng trở nên quan trọng hơn trong tương lai. Chúng tôi mong muốn sử dụng Blackwell của Nvidia để giúp đào tạo các mô hình AI nguồn mở Llama của chúng tôi và xây dựng thế hệ Meta AI và sản phẩm tiêu dùng tiếp theo.”
Satya Nadella, chủ tịch điều hành kiêm giám đốc điều hành của Microsoft: “Chúng tôi cam kết cung cấp cho khách hàng cơ sở hạ tầng tiên tiến nhất để hỗ trợ khối lượng công việc AI của họ. Bằng cách đưa siêu chip GB200 Grace Blackwell đến các trung tâm dữ liệu của chúng tôi trên toàn cầu, Microsoft đang xây dựng trên lịch sử lâu đời của mình về việc tối ưu hóa GPU Nvidia cho đám mây của công ty, góp phần giúp chúng tôi biến lời hứa về AI thành hiện thực cho các tổ chức ở khắp mọi nơi.”
Sam Altman, CEO của OpenAI: “Blackwell mang đến những bước nhảy vọt về hiệu suất và sẽ đẩy nhanh khả năng cung cấp các mô hình tiên tiến của chúng tôi".
Larry Ellison, chủ tịch kiêm giám đốc công nghệ của Oracle: "Sự hợp tác chặt chẽ của Oracle với Nvidia sẽ tạo ra những đột phá về mặt định tính và định lượng trong AI, máy học và phân tích dữ liệu. Để khách hàng khám phá ra nhiều thông tin chi tiết có thể hành động hơn, cần có một công cụ mạnh mẽ hơn như Blackwell, được xây dựng có mục đích cho việc tính toán tăng tốc và AI tạo ra."
Có thể thấy, Nvidia liên tục tạo ra những cuộc cách mạng cho ngành điện toán. Diễn đàn Kinh tế Thế giới (WEF) bình luận, với sự xuất hiện của siêu chip GB200 Grace Blackwell nói riêng và Nền tảng Blackwell nói chung, Nvidia đang giúp thế giới tăng đáng kể tốc độ xử lý và đào tạo AI. Sự phát triển này có thể dẫn đến những đột phá trong các lĩnh vực như siêu vũ trụ, sản xuất, robot và chăm sóc sức khỏe...
Tham khảo: Nvidia News, WEF, The Verge