NVIDIA DGX Spark AI: 'Siêu máy tính mini' tăng hiệu năng gấp 2,5 lần, tối ưu hóa cực mạnh cho Video AI và Mod game
-
Người viết: Sebastian
/
Kể từ khi ra mắt vào tháng 10 năm ngoái, chiếc siêu máy tính bỏ túi DGX Spark của NVIDIA đã nhanh chóng trở thành tâm điểm chú ý trong giới công nghệ AI. Không dừng lại ở những thông số ban đầu, NVIDIA vừa tiếp tục chứng minh khả năng tối ưu hóa phần mềm bậc thầy của mình khi công bố mức tăng trưởng hiệu năng lên tới 2,5 lần cho thiết bị này, giúp đẩy nhanh quá trình sáng tạo nội dung bằng GenAI và nhiều tác vụ quan trọng khác.
DGX Spark được thiết kế như một hệ thống chuyên dụng cho các khối lượng công việc AI phức tạp. Kể từ khi được CEO Jensen Huang trực tiếp bàn giao những đơn vị đầu tiên, thiết bị đã nhận được hàng loạt bản cập nhật OTA, giúp cải thiện đáng kể cả về độ ổn định lẫn hiệu suất thực tế.

Trong thông báo mới nhất, NVIDIA cho biết nhờ hỗ trợ định dạng NVFP4, DGX Spark giờ đây mang lại mức tăng hiệu năng lên tới 2,5 lần khi chạy mô hình Qwen 235B (trong cấu hình ghép đôi hai máy). Bên cạnh đó, các tối ưu hóa CUDA đã giúp hiệu suất trong Omniverse Isaac Sim tăng gấp đôi. Các mô hình phổ biến khác như Qwen3 30B và Stable Diffusion 3.5 cũng ghi nhận mức cải thiện hơn 30%, cùng với những bước tiến đáng kể từ các bản cập nhật PyTorch.

Mở rộng hệ sinh thái với DGX Spark Playbooks mới
Để hỗ trợ cộng đồng lập trình viên, NVIDIA đang mở rộng danh sách "DGX Spark Playbooks" – những bộ cẩm nang hướng dẫn xây dựng và triển khai các tác vụ AI. Bản cập nhật mới bao gồm 7 kịch bản triển khai mới và 4 cập nhật lớn, tập trung vào các lĩnh vực:
- vLLM và SGLang phục vụ suy luận (inference).
- TRT-LLM hỗ trợ Speculative Decoding (Giải mã suy đoán).
- Chạy mô hình Nemotron-3-Nano trực tiếp tại chỗ.
- Phân tích giải trình tự RDA đơn bào.
- Tối ưu hóa danh mục đầu tư định lượng.
- Giao diện WebUI cho VLM trực tiếp.
- Quy trình làm việc Robot trong Isaac Sim và Isaac Lab.

Cánh tay đắc lực cho nhà sáng tạo: Tăng tốc video AI gấp 8 lần
Một trong những điểm nhấn ấn tượng nhất là khả năng phối hợp của DGX Spark như một thiết bị xử lý ngoại biên (offloading box) để tăng tốc quy trình làm việc. NVIDIA đã trình diễn ví dụ DGX Spark kết hợp cùng một chiếc MacBook Pro để xử lý video AI. Kết quả thật kinh ngạc: tốc độ tạo video được đẩy nhanh gấp 8 lần.
Bằng cách tận dụng khả năng tính toán FP4/FP8 của DGX Spark cùng công nghệ RTX Video Super Resolution, hệ thống có thể xuất một video 4K chỉ trong vòng 1 phút, thay vì mất tới 8 phút nếu chỉ sử dụng sức mạnh nội tại của MacBook Pro.

Đột phá trong thiết kế 3D và Mod game với RTX Remix
Đối với những người làm việc trong lĩnh vực 3D hoặc cộng đồng modder game, DGX Spark là một sự bổ sung hoàn hảo cho hệ thống chạy card đồ họa RTX. Người dùng có thể đẩy các tác vụ nặng như tạo vân bề mặt (Texture Generation) sang DGX Spark, để card đồ họa chính (như RTX 5090) rảnh tay tập trung vào các công việc sáng tạo chuyên sâu khác.
Với bộ nhớ thống nhất (unified memory) lên tới 128 GB, các tác vụ ngốn tài nguyên và bộ nhớ được xử lý mượt mà trên Spark, giúp việc nâng cấp đồ họa game qua RTX Remix trở nên nhanh chóng và chính xác hơn bao giờ hết.


Lập trình CUDA ngoại tuyến với Nsight Copilot AI
Thêm một tính năng đáng giá là khả năng phát triển CUDA ngoại tuyến (offline) thông qua Nsight Copilot AI. Trước đây, do yêu cầu về tài nguyên, việc này thường chỉ khả thi trên đám mây. Tuy nhiên, với sức mạnh tính toán 1 PFLOP và 128 GB bộ nhớ, DGX Spark có thể chạy Nsight Copilot một cách trơn tru tại chỗ, đảm bảo dữ liệu và tài sản trí tuệ của nhà phát triển luôn được giữ an toàn trong mạng nội bộ.





Có thể thấy, những cập nhật mới nhất đã biến DGX Spark từ một thiết bị hứa hẹn trở thành một công cụ thực thụ, không thể thiếu cho các nhà phát triển AI và những nhà sáng tạo nội dung muốn bứt phá giới hạn hiệu năng trong công việc hàng ngày.