NVIDIA công bố siêu chip thế hệ mới “Vera Rubin” – Bước nhảy vọt cho kỷ nguyên AI Exascale

NVIDIA công bố siêu chip thế hệ mới “Vera Rubin” – Bước nhảy vọt cho kỷ nguyên AI Exascale


Tại sự kiện GTC 2025 vừa qua, NVIDIA đã chính thức trình làng thế hệ siêu chip AI hoàn toàn mới mang tên “Vera Rubin Superchip”. Đây là nền tảng hợp nhất CPU và GPU được thiết kế đặc biệt cho các trung tâm dữ liệu AI quy mô lớn, mở ra kỷ nguyên AI Exascale với hiệu năng vượt xa dòng Blackwell hiện tại.
Theo công bố từ NVIDIA, Vera Rubin sẽ bắt đầu sản xuất hàng loạt vào năm 2026, và được xem là “nền móng” cho thế hệ siêu máy chủ AI trong tương lai.


Kiến trúc và thông số kỹ thuật

 

Cấu trúc Vera Rubin Superchip
Ảnh minh họa bo mạch chủ kết hợp CPU Vera và GPU Rubin.

 

🔹 Cấu hình phần cứng

  • CPU “Vera”: 88 nhân ARM tùy chỉnh, 176 luồng, tối ưu cho khối lượng xử lý AI.
  • GPU “Rubin”: Gồm hai chip GPU cỡ reticle (die lớn nhất có thể sản xuất), mỗi GPU hỗ trợ 8 mô-đun bộ nhớ HBM4 tốc độ cực cao.
  • Bộ nhớ hệ thống: 32 khe LPDDR kết hợp với HBM4 giúp tăng băng thông tổng thể.
  • Hiệu năng:
    • Hệ thống “NVL144” (2 GPU Rubin + 1 CPU Vera): ~3.6 Exaflops FP4 inference và 1.2 Exaflops FP8 training.

  • Dự kiến “NVL576” (2027): đạt tới 15 Exaflops FP4 inference.

🔹 Công nghệ liên kết mới

  • NVLink và CX interconnect thế hệ mới giúp giảm độ trễ và tăng thông lượng kết nối giữa CPU và GPU.

  • Bộ nhớ HBM4 mang lại băng thông cực cao, rất cần thiết cho các mô hình AI hàng trăm tỷ tham số.

  • Toàn bộ thiết kế hướng tới mục tiêu tối đa hóa hiệu quả năng lượng trên mỗi watt, một yếu tố sống còn với trung tâm dữ liệu.


🚀 Ý nghĩa và tầm ảnh hưởng

 

GPU Rubin và mô-đun HBM4
Sự kết hợp CPU – GPU – bộ nhớ – interconnect thành một khối thống nhất giúp Vera Rubin đạt hiệu năng vượt trội.

 

Sự ra mắt của Vera Rubin đánh dấu bước chuyển lớn của NVIDIA: từ việc chỉ tập trung vào GPU sang tích hợp toàn bộ nền tảng tính toán AI.
Điều này cho phép:

  • Giảm độ trễ giữa CPU và GPU.

  • Tăng tốc độ huấn luyện mô hình AI lớn.

  • Mở rộng khả năng inference real-time với năng lượng tối ưu hơn.

Đây là nền tảng được kỳ vọng thay thế dòng Blackwell Ultra, đồng thời củng cố vị thế dẫn đầu của NVIDIA trong cuộc đua AI với AMD, Intel và các hãng chip chuyên dụng khác.


Triển vọng và tác động

Đối với các trung tâm dữ liệu AI và doanh nghiệp triển khai mô hình ngôn ngữ lớn (LLM), Vera Rubin sẽ là lựa chọn hàng đầu trong giai đoạn 2026–2027.
Tuy nhiên, mức tiêu thụ điện năng và chi phí đầu tư cũng được dự đoán rất lớn, nên nền tảng này không hướng tới người dùng cá nhân hoặc doanh nghiệp nhỏ.

Đối thủ chính là AMD MI355X và các giải pháp Gaudi3 của Intel, nhưng xét về băng thông bộ nhớ và tích hợp CPU-GPU, NVIDIA vẫn đang dẫn đầu.


Vera Rubin Superchip không chỉ là “một GPU mạnh hơn” — mà là một hệ sinh thái tính toán hợp nhất dành cho kỷ nguyên AI siêu quy mô.
Khi được thương mại hóa vào cuối năm 2026, đây sẽ là nền tảng trung tâm cho các mô hình AI Exascale – nơi hiệu năng, bộ nhớ và năng lượng đều được tối ưu cùng lúc.

Nếu anh em đang theo dõi xu hướng AI infrastructure, Vera Rubin chính là cái tên cần đặt vào danh sách “watchlist” ngay từ bây giờ.