CEO Micron Cảnh Báo: AI Mới Chỉ Là “Khởi Đầu” Khi Nguồn Cung Bộ Nhớ Thắt Chặt, Nhu Cầu DRAM và NAND Sẽ Vượt 50% Tổng Thị Trường

CEO Micron Cảnh Báo: AI Mới Chỉ Là “Khởi Đầu” Khi Nguồn Cung Bộ Nhớ Thắt Chặt, Nhu Cầu DRAM và NAND Sẽ Vượt 50% Tổng Thị Trường


Micron vừa báo cáo một quý 2 kỷ lục nhờ nhu cầu DRAM tăng vọt, nhưng CEO của hãng cho rằng đây mới chỉ là khởi đầu khi AI đòi hỏi nhiều bộ nhớ hơn nữa để phát huy hết tiềm năng của mình.


Nhà sản xuất bộ nhớ và lưu trữ hàng đầu, Micron, đã chứng kiến sự tăng trưởng vượt bậc trên tất cả các mảng kinh doanh của mình, bao gồm DRAM, NAND và HBM. Sự tăng trưởng ngoạn mục này đến từ nhu cầu sản phẩm tăng vọt khi cơn sốt AI tác nhân (Agentic AI) tiếp tục thổi bùng sức nóng cho mọi công ty sản xuất bộ nhớ và lưu trữ.

Trong một cuộc trò chuyện với CNBC, CEO của Micron, ông Sanjay Mehrotra, cho biết những gì chúng ta đang chứng kiến trong ngành AI hiện nay mới chỉ là khởi đầu, ông gọi đó là “First Innings” (những hiệp đấu đầu tiên) – một cách nói ẩn dụ trong bóng chày, ám chỉ giai đoạn sơ khai. Khi các công ty AI mở rộng quy mô tính toán, bộ nhớ nhanh hơn và mật độ cao hơn sẽ trở thành một thành phần cực kỳ quan trọng để giữ cho guồng quay AI luôn vận hành trơn tru.

 

AI đang ở những hiệp đấu rất sớm; bạn vừa thấy tại GTC những tiến bộ vượt bậc đang được thực hiện trong AI. Và bộ nhớ là một tài sản chiến lược; bạn cần nhiều bộ nhớ hơn, bạn cần bộ nhớ hiệu suất nhanh hơn để AI có thể phát huy hết khả năng của nó.

Đây là điểm uốn suy luận (inference inflection). Khi suy luận được mở rộng, nó sẽ tăng cường nhu cầu về mã thông báo (tokens), và những mã thông báo đó cần phải nhanh chóng. Và bạn biết gì không, bạn cần nhiều bộ nhớ hơn, bạn cần bộ nhớ nhanh hơn để phát huy hết tiềm năng của bộ nhớ.

Và nguồn cung bộ nhớ hiện nay đang rất khan hiếm, và nguồn cung không thể được bổ sung dễ dàng, bạn đang thấy điều đó trong kết quả của chúng tôi.

_Sanjay Mehrotra - Chủ tịch, Tổng giám đốc điều hành Micron_

 

Để các mô hình AI chạy nhanh hơn và tăng tốc độ tạo mã thông báo, cần nhiều sức mạnh tính toán hơn, và bộ nhớ là yếu tố thiết yếu của tính toán. GPU AI đòi hỏi HBM, CPU AI đòi hỏi DRAM, và điều đáng nói là tất cả đều đang trong tình trạng thiếu hụt nguồn cung nghiêm trọng. Vấn đề không nằm ở nhu cầu hay giá cả; mà là vấn đề về nguồn cung mà các công ty lớn đang gặp khó khăn trong việc giải quyết, và với triển vọng tương lai, mọi thứ dường như sẽ không tốt hơn.

Các GPU đang tích cực hướng tới việc bổ sung các chuẩn HBM mới hơn và có mật độ cao hơn. Các dòng sản phẩm sắp ra mắt như Vera Rubin và MI400 với hỗ trợ HBM4 sẽ không chỉ tăng băng thông mà còn tối đa hóa dung lượng, đặt ra tiêu chuẩn cho các giải pháp HBM thế hệ tiếp theo. Mặt khác, DRAM đang tăng trưởng với tốc độ nhanh chóng, với nhu cầu vượt xa nguồn cung do sự gia tăng của khối lượng công việc AI tác nhân đang thúc đẩy các CPU tăng hỗ trợ bộ nhớ lên đến 400 GB. LPDDR đã trở thành lựa chọn ưa thích mới của kỷ nguyên AI nhờ hồ sơ hiệu quả năng lượng vượt trội của nó, khiến chúng trở nên hoàn hảo cho các triển khai quy mô lớn.

 

Micron giới thiệu module HBM4

 

Micron đã thiết lập các kỷ lục mới về doanh thu, biên lợi nhuận gộp, EPS và dòng tiền tự do trong quý 2 tài chính, được thúc đẩy bởi môi trường nhu cầu mạnh mẽ, nguồn cung ngành thắt chặt và sự thực thi hiệu quả của chúng tôi, và chúng tôi kỳ vọng sẽ có những kỷ lục đáng kể một lần nữa trong quý 3 tài chính,” Sanjay Mehrotra, Chủ tịch và CEO của Micron Technology cho biết. “Trong kỷ nguyên AI, bộ nhớ đã trở thành một tài sản chiến lược cho khách hàng của chúng tôi, và chúng tôi đang đầu tư vào dấu ấn sản xuất toàn cầu để hỗ trợ nhu cầu ngày càng tăng của họ.

 

Theo quỹ đạo mới nhất, nhu cầu AI đối với DRAM và NAND dự kiến sẽ vượt quá 50% tổng TAM (Total Addressable Market) của ngành trong năm nay. Một lần nữa, Micron chỉ ra rằng nhu cầu máy chủ truyền thống và máy chủ AI vẫn mạnh mẽ, nhưng bị hạn chế do thiếu hụt nguồn cung DRAM và NAND. Nhu cầu DRAM sẽ tiếp tục tăng với sự ra đời của các nền tảng được làm mới và mới hơn.

Micron đang cung cấp HBM4 36GB (12-Hi) DRAM cho nền tảng Vera Rubin của NVIDIA và dự kiến đạt được sản lượng ổn định trên các quy trình HBM3 hiện có. Công ty cũng đang phát triển bộ nhớ HBM4E HBM thế hệ tiếp theo, dự kiến sẽ tăng tốc vào năm tới. Về LPDDR, công ty gần đây đã ra mắt bộ nhớ SOCAMM2 256 GB với các mô-đun LPDDR5X cung cấp dung lượng lên đến 2 TB, và cũng đang cung cấp DDR5 cho Groq 3 LPX của NVIDIA. Groq LPU cung cấp dung lượng lên đến 12 TB mỗi chip.

 

Bộ nhớ DDR5 của Crucial

 

Về mảng tiêu dùng, Micron dự kiến doanh số PC và điện thoại di động sẽ giảm ở mức thấp hai chữ số do nguồn cung hạn chế và giá cao hơn. Công ty cũng nhấn mạnh rằng 32 GB đã trở thành lựa chọn mặc định cho các PC đang chạy các quy trình làm việc AI tác nhân cục bộ.