Chi Phí Training AI Của DeepSeek Thực Tế Cao Gấp 400 Lần Con Số Được Công Bố

Chi Phí Training AI Của DeepSeek Thực Tế Cao Gấp 400 Lần Con Số Được Công Bố


Cuộc tranh cãi xoay quanh chi phí đào tạo mô hình R1 của DeepSeek đã làm rung chuyển thị trường, nhưng có vẻ như còn khá nhiều khúc mắc trong câu chuyện này, khi các con số thực tế khiến nhiều người phải bất ngờ.


Công ty nghiên cứu SemiAnalysis đã thực hiện một phân tích chuyên sâu về chi phí thực tế mà DeepSeek sử dụng để đào tạo mô hình AI của họ, bác bỏ quan điểm cho rằng R1 đã đạt hiệu suất tối ưu đến mức không cần đến tài nguyên tính toán từ NVIDIA và các đối tác khác.

 

ThinkSystem NVIDIA H200 141GB GPUs Product Guide > Lenovo Press

DeepSeek không cần đến chip AI mạnh nhất thế giới Nvidia H200

 

Ban đầu, ngành công nghiệp AI tin rằng DeepSeek chỉ chi khoảng 5 triệu USD để huấn luyện mô hình R1, con số ngang bằng với mô hình GPT-4o của OpenAI. Thông tin này đã gây hoảng loạn khắp giới đầu tư, dẫn đến sự xáo trộn trên thị trường chứng khoán Mỹ. Tuy nhiên, khi mọi thứ dần sáng tỏ, các con số thực sự lại hoàn toàn khác biệt.

 

High-Flyer, the AI Quant Fund Behind DeepSeek | Newsmax.com

High Flyer, công ty đứng sau Deepseek của Trung Quốc

 

Theo SemiAnalysis, DeepSeek ban đầu chỉ là một dự án phụ của quỹ đầu tư phòng hộ Trung Quốc High-Flyer. Báo cáo cho biết công ty này đã mua 10.000 GPU NVIDIA A100 vào năm 2021, trước khi các lệnh cấm xuất khẩu của Mỹ trở nên nghiêm ngặt hơn. Sau đó, DeepSeek tách ra thành một thực thể riêng biệt khi High-Flyer quyết định chuyển dự án này thành một công ty độc lập. Kể từ đó, DeepSeek đã tích lũy một lượng tài nguyên tính toán khổng lồ.

Cụ thể, báo cáo cho thấy DeepSeek hiện đang sở hữu 10.000 GPU NVIDIA H800 (phiên bản dành riêng cho Trung Quốc), 10.000 GPU NVIDIA H100 (phiên bản cao cấp hơn) và một số lượng lớn GPU NVIDIA H20 AI, đồng thời họ còn có hệ thống điện toán chung với High-Flyer phục vụ các mục đích giao dịch tài chính, suy luận AI, huấn luyện mô hình và nghiên cứu. Tổng cộng, DeepSeek đã đầu tư khoảng 1,6 tỷ USD vào tài sản cố định (CapEx), trong khi chi phí vận hành ước tính lên đến 944 triệu USD. Như vậy, con số thực tế cao hơn khoảng 400 lần so với những gì thị trường từng nghĩ.

 

How DeepSeek is Revolutionizing AI with Open-Source Models | by Bijutoha |  Jan, 2025 | Medium

 

Số tiền 5 triệu USD được cho là chỉ phản ánh một phần rất nhỏ của chi phí đào tạo, có thể là chỉ tính riêng chi phí vận hành mô hình đã hoàn thiện. DeepSeek thực sự đã làm rất tốt trong việc thu hút nhân tài nội địa, thông qua các sự kiện tuyển dụng tại các đại học hàng đầu Trung Quốc, với mức lương trên 1,3 triệu USD dành cho các nhân sự chủ chốt. Dù đội ngũ DeepSeek R1 đã tạo ra một giải pháp AI hiệu quả và cạnh tranh với OpenAI, nhưng việc công bố sai lệch số liệu tài chính đã góp phần châm ngòi cho sự kiện "thiên nga đen" (black swan event) trên thị trường chứng khoán vào tuần trước.

Why this overlooked 'black swan' poses a 'monstrous' risk to the stock  market - MarketWatch