OpenAI

OpenAI "chốt đơn" khủng: Trở thành khách hàng lớn nhất cho dòng chip NVIDIA-Groq với công suất 3GW


Mối quan hệ hợp tác mới nhất giữa OpenAI và NVIDIA không chỉ dừng lại ở thế hệ chip Vera Rubin, mà còn tập trung mạnh mẽ vào khả năng suy luận (inference capacity) – yếu tố then chốt sẽ được cung cấp bởi giải pháp NVIDIA-Groq sắp ra mắt.


OpenAI hiện đang tích cực thực hiện các thỏa thuận tài chính với các đối tác hạ tầng trong toàn ngành AI. Gã khổng lồ này gần đây đã công bố huy động được 110 tỷ USD vốn mới, với sự dẫn dắt của các tên tuổi lớn như NVIDIA, SoftBank và Amazon. OpenAI gọi các khoản đầu tư này là sự cần thiết sống còn để duy trì đà phát triển của AI, đồng thời đây cũng là cách giúp công ty đảm bảo nguồn năng lượng tính toán cần thiết.

Theo báo cáo từ Wall Street Journal (WSJ), NVIDIA dự kiến sẽ trình làng bộ vi xử lý tập trung vào công nghệ của Groq tại sự kiện GTC 2026 diễn ra trong năm nay. Điều này hoàn toàn trùng khớp với các rò rỉ trước đó về lộ trình của hãng.

Đáng chú ý hơn, OpenAI sẽ là khách hàng lớn nhất cho giải pháp sắp tới này. Trong cam kết đầu tư gần đây của NVIDIA vào OpenAI, thông tin tiết lộ rằng OpenAI sẽ sử dụng tới 3GW "công suất suy luận chuyên dụng" (dedicated inference capacity), nhiều khả năng sẽ đến từ những gì mà NVIDIA trình diễn vào tháng 3 tới.

Các báo cáo trước đó từng chỉ ra rằng khả năng suy luận là mối lo ngại lớn đối với OpenAI trong thời gian qua. Thậm chí, công ty từng được cho là "không hài lòng" với những gì NVIDIA cung cấp để giải quyết bài toán suy luận, dẫn đến những tin đồn về việc OpenAI tìm kiếm các giải pháp thay thế hiệu quả hơn.

 

"OpenAI đã đồng ý trở thành một trong những khách hàng lớn nhất cho bộ vi xử lý mới, đánh dấu một chiến thắng quan trọng cho NVIDIA. Nhà tạo lập ChatGPT, vốn là một trong những khách hàng lớn nhất của NVIDIA, đã dành vài tháng qua để tìm kiếm các lựa chọn thay thế hiệu quả hơn cho các dòng chip hiện tại của hãng." - Trích dẫn từ WSJ.

 

Giải bài toán độ trễ với kiến trúc lai

Từng có thông tin cho rằng OpenAI đã đàm phán với Cerebras và Groq để đạt được các thỏa thuận tập trung vào việc cung cấp hiệu năng tối ưu cho các khối lượng công việc nhạy cảm với độ trễ. Tuy nhiên, ở thời điểm hiện tại, có vẻ như OpenAI đã quyết định gắn bó với NVIDIA. Điều này cho thấy giải pháp mới được xây dựng xung quanh các chip LPU của Groq đủ hứa hẹn để gã khổng lồ AI cam kết mức công suất khổng lồ 3GW.

 

Hệ thống phần cứng NVIDIA Rubin Vera

 

Về mặt kỹ thuật, giải pháp kết hợp giữa NVIDIA và Groq được kỳ vọng sẽ là một cấu hình khay tính toán lai (hybrid compute tray). Đây là một bước đi chiến lược giúp NVIDIA duy trì vị thế thống trị khi thị trường AI dịch chuyển từ huấn luyện mô hình (training) sang thực thi suy luận (inference) trên quy mô lớn.

Tại sự kiện GTC năm nay, giới công nghệ đang đổ dồn sự chú ý vào các thông báo quan trọng từ NVIDIA, tập trung vào kiến trúc Vera Rubin, có thể là thế hệ Feynman tiếp theo, và đặc biệt là giải pháp phần cứng xây dựng dựa trên nền tảng của Groq.