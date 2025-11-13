Vấn đề lớn nhất của không phải là thiếu chip AI

Với chiến lược của các ông lớn công nghệ, bong bóng AI đã phình to nhanh chóng nhờ hoạt động thương mại GPU. Tuy nhiên, gần đây, CEO Microsoft Satya Nadella đã bất ngờ "dội gáo nước lạnh" vào sự thật này: "Vấn đề lớn nhất của chúng tôi hiện nay không phải là thiếu chip AI, mà là thiếu nguồn điện"

Sự thiếu hụt điện năng đang kìm hãm AI. Báo cáo do Bộ Năng lượng Hoa Kỳ công bố vào tháng 12/2024 cho thấy vào năm 2023, các trung tâm dữ liệu của Hoa Kỳ đã tiêu thụ 4,4% tổng lượng điện của cả nước, đạt 176 terawatt giờ, tương đương với tổng lượng điện tiêu thụ hàng năm của Malaysia. Đến năm 2028, con số này có thể tăng gấp đôi.

Hơn nữa, AI tiêu tốn điện nhưng chưa mang lại hiệu quả xứng đáng với những gì đã bỏ ra. Hiệu quả sử dụng năng lượng (PUE) là một chỉ số quan trọng để đo lường hoạt động của các trung tâm dữ liệu. Phương pháp tính toán rất đơn giản: chia tổng mức tiêu thụ điện năng của trung tâm dữ liệu cho mức tiêu thụ điện năng của các máy chủ.

Năm 2024, PUE trung bình toàn cầu là 1,56. Điều này có nghĩa là chỉ 2/3 lượng điện được sử dụng cho tính toán GPU, trong khi 1/3 còn lại được tiêu thụ cho các hoạt động khác như làm mát, hệ thống cung cấp điện và chiếu sáng.

Mặt khác, hệ thống điện lực của Hoa Kỳ đã xuống cấp, hiện chỉ sản xuất được rất ít. Việc tiếp tục cắt giảm sẽ gây nguy hiểm cho các nhu cầu thiết yếu.

Bức tranh lớn hơn

Biểu đồ từ Cục Thống kê Lao động Hoa Kỳ cho thấy rõ ràng giá điện tăng vọt từ năm 2021 đến năm 2022. Không có điện, những GPU mà các gã khổng lồ công nghệ tranh nhau mua sắm và nâng cấp sẽ chỉ nằm phủ bụi trong phòng máy chủ. Và chẳng bao lâu nữa, chúng sẽ phải đối mặt với một tình huống còn tệ hại hơn: lỗi thời.

Tuổi thọ của chip sẽ dần được kéo dài khi sản xuất hàng loạt và vận chuyển thế hệ chip tiếp theo.

Chip AI chính thống có thể vẫn dựa trên H100 và A100 từng được săn lùng. Tuy nhiên đến nay, những con chip này đều là sản phẩm cũ, ra mắt cách đây 22 năm. Chúng chỉ có lợi thế về năng lực sản xuất chứ không phải là chip tốt nhất hay mới nhất hiện nay. Xếp sau chúng là H200 từ năm 2023, B200 từ năm 2024 và B300 từ năm 2025, tất cả đều đang chờ được ra mắt.

Theo dự báo của TrendForce vào tháng 7 năm nay, đến cuối năm 2025, tỷ lệ xuất xưởng dòng Blackwell sẽ đạt hơn 80% tổng sản lượng GPU cao cấp của NVIDIA, giúp tăng đáng kể năng lực sản xuất.

Điều này có nghĩa là nếu H100 trong kho OpenAI tiếp tục không thể hoạt động do thiếu điện, chúng có thể được thay thế trực tiếp bằng B200 và B300 và không bao giờ có cơ hội được sử dụng.

Điều này không chỉ gây lãng phí mà còn ảnh hưởng đến giá cổ phiếu, vốn là mối quan tâm hàng đầu của các công ty AI. Nếu những con chip chỉ được mua về mà không được sử dụng thì mỗi phút, mỗi giây chúng nằm im lìm đang chứng kiến sự sụp đổ của bong bóng AI.

Không còn lựa chọn nào khác, các công ty công nghệ không còn cách nào khác ngoài việc phải dùng đến các biện pháp "tự cứu".

Ưu thế của Trung Quốc

Suy cho cùng, việc mua chip không thể dừng lại vì nếu bạn không mua, người khác sẽ mua. Nhưng thực sự không có đủ điện để vận hành.

Giải pháp được nhiều ông lớn lựa chọn là xây dựng các nhà máy điện ở khắp mọi nơi. Ví dụ, OpenAI và Oracle đang hợp tác xây dựng một nhà máy điện khí đốt tự nhiên ở Texas, và xAI cũng đang đầu tư mạnh vào cơ sở hạ tầng ở Tennessee. Một số khác thì chọn chuyển trung tâm dữ liệu ra nước ngoài.

Mexico, Chile và một số quốc gia Nam Phi đã trở thành những đầu tàu phát triển AI. Tuy nhiên, nguồn cung cấp điện tại các khu vực này vốn đã kém phát triển, và tình trạng này càng trở nên trầm trọng hơn.

Ở Ireland, các trung tâm dữ liệu tiêu thụ 20% lượng điện của cả nước và tình trạng mất điện cũng như tiêu thụ nước đã ảnh hưởng đến cuộc sống của người dân địa phương và môi trường sinh thái.

Thậm chí Nvidia và Google đều đã cân nhắc việc chuyển các trung tâm dữ liệu của họ ra ngoài vũ trụ. Bằng cách đưa chip vào không gian thông qua vệ tinh và bao quanh nó bằng các tấm pin mặt trời, chúng có thể có được nguồn cung cấp năng lượng liên tục 24 giờ.

Việc tản nhiệt hoàn toàn dựa vào bức xạ nhiệt chân không, nên không cần phải lo lắng về tình trạng khan hiếm nước hay hiện tượng nóng lên toàn cầu.

Tuy nhiên, thí nghiệm mới chỉ bắt đầu, và không có gì đảm bảo kết quả sẽ tốt. Các linh kiện điện tử có bị lão hóa nhanh hơn trong không gian hay không, công suất và khả năng tản nhiệt có đáp ứng được kỳ vọng hay không, cách truyền dữ liệu đã được huấn luyện về trái đất, kiểm soát chi phí… đều là những vấn đề cần xem xét.

Ngược lại hoàn toàn, tình hình của Trung Quốc được đánh giá là khả quan hơn nhiều.

Năm 2024, tổng lượng điện năng tiêu thụ của các trung tâm dữ liệu tại nước tôi đạt 166 terawatt-giờ, chiếm khoảng 2% tổng lượng điện năng tiêu thụ toàn xã hội.

Là một quốc gia nổi tiếng về năng lực cơ sở hạ tầng, Trung Quốc không chỉ đảm bảo cung cấp đủ điện trong khi ưu tiên sinh kế của người dân mà còn theo đuổi điện xanh và giảm phát thải carbon.