
NVIDIA DGX Spark
DGX个人AI 计算机,专为构建和运行 AI 而设计。
桌面端 AI 计算需求
⽣成式 AI 模型的规模和复杂性与⽇俱增,这使得本地系统的开发⼯作更具挑战性。
在本地进⾏⼤模型的原型设计、微调和推理需要⼤量显存和出⾊的计算性能。随着
企业、软件提供商、政府机构、初创企业和研究⼈员不断加⼤ AI 开发⼯作⼒度,
对 AI 计算资源的需求也持续增⻓。
桌面端的 200B 参数模型
NVIDIA DGX™ Spark 是专为完整构建和运⾏ AI ⽽设计的新型计算机。NVIDIA DGX Spark 搭载了 NVIDIA GB10 Grace Blackwell 超级芯⽚,基于先进的 NVIDIA Grace Blackwell 架构设计,能够提供⾼达 1000 AI TOPS 的性能,为⼤型 AI ⼯作负载提供
动⼒。借助 128 GB 的统一寻址系统内存,开发⼈员可以对多达 200B 参数的模型进⾏试验、微调或推理。此外,NVIDIA ConnectX™ ⽹络可以连接两台 NVIDIA DGX Spark AI 超级计算机,从⽽⽀持对多达 405B 参数的模型进⾏推理。
为了给开发者带来熟悉的体验,NVIDIA DGX Spark 采⽤了与⼯业级 AI ⼯⼚相同的
软件架构。基于 NVIDIA DGX OS 和 Ubuntu Linux 并预先配置最新的 NVIDIA AI 软件堆栈,以及对开发⼈员开放 NVIDIA NIM™ 和 NVIDIA Blueprint 的访问权限,开发⼈员可以使⽤ Pytorch、Jupyter 和 Ollama 等常⽤⼯具在 NVIDIA DGX Spark 上进⾏原型设计、微调和推理,并⽆缝部署到数据中⼼或云基础设施。
NVIDIA DGX Spark 在⼩巧的封装中提供出⾊的性能和强⼤的功能,助⼒开发者、
研究⼈员、数据科学家和学⽣继续突破⽣成式 AI 的边界。
基于 NVIDIA Grace Blackwell 架构
NVIDIA DGX Spark 的核⼼是新的 GB10 Grace Blackwell 超级芯⽚,该芯⽚基于 NVIDIA Grace Blackwell 架构,并针对桌⾯端外形进⾏了优化。GB10 配备功能强⼤的 NVIDIA Blackwell GPU,⽀持第五代 Tensor Core 和 FP4,可提供⾼达 1000 TOPS 的
AI 计算性能。GB10 还包含⾼性能 Grace 20-core Arm CPU,可强效助⼒数据预处理和编排,从⽽加速模型调整和实时推理。GB10 超级芯⽚使⽤ NVLink™-C2C 互联技术,提供 CPU + GPU 相结合的⼀致性内存模型,带宽是第五代 PCIe 的 5 倍。
主要特性
>
基于 NVIDIA GB10 Grace Blackwell 超级芯片构建
>
配备 NVIDIA Blackwell GPU,
⽀持第五代 Tensor Core 技术
>
NVIDIA Grace CPU 采用⾼性能20-core Arm 架构
>
支持 FP4,可提供⾼达1000 TOPS 的 AI 性能
>
128 GB 统一寻址系统内存
>
支持高达 200B 参数的模型
>
NVIDIA ConnectX™ 网络可连接
两台系统,从而支 持对高达 405B 参数的模型进行处理
>
支持高达 4 TB 的 NVMe 存储
>
小巧的桌面端外形
与新⼀代⼤参数 AI 模型协同⼯作
凭借 128 GB 的统一寻址系统内存和对 FP4 数据格式的⽀持,NVIDIA DGX Spark 可以⽀持多达 200B 参数的 AI 模型,使 AI 开发⼈员能够在桌⾯端对新⼀代 AI 推理模型
进⾏原型设计、微调和推理。借助内置的 NVIDIA ConnectX ⽹络技术,可以连接两台 NVIDIA DGX Spark 系统,以处理 Llama 3.1 405B 等更⼤的模型。
本地开发,随时随地进⾏⼤规模部署
NVIDIA DGX Spark 为企业组织和开发者提供了⼀个功能强⼤且经济实惠的实验场地,⽤于原型设计模型,从⽽释放出更适合训练和部署⽣产模型的集群环境中宝贵的计算
资源。NVIDIA AI 平台的软件架构⽀持 NVIDIA DGX Spark ⽤⼾将其模型从桌面端⽆缝迁移到 DGX Cloud 或任何加速云或数据中⼼基础设施,⽽⼏乎⽆需更改代码,因此
⽐以往都更容易进⾏原型设计、微调和迭代。
技术规格*
架构NVIDIA Grace Blackwell
GPU NVIDIA Blackwell 架构
CPU 20 core Arm,10 Cortex-X925
+ 10 Cortex-A725 Arm
CUDA 核心 NVIDIA Blackwell Generation
Tensor Core 第 5 代
RT Core 核心 第 4 代
Tensor Performance1 1000 AI TOPS
系统内存 128 GB LPDDR5x,统一寻址系统内存
内存接口 256-bit
内存位宽 273 GB/秒
存储具有⾃加密功能的 1 TB 或 4 TB NVME.M2
USB 4 个 USB TypeC (高达 40GB/s)
以太网 1 个 RJ-45 接⼝ 10 GbE
网卡 ConnectX-7 智能网卡
Wi-Fi WiFi 7
蓝牙 BT 5.3 (支持低功耗技术)
音频输出 HDMI 多通道⾳频输出
功耗 待定
显示器接口 1 个 HDMI 2.1a
NVENC | NVDEC 1x | 1x
操作系统 NVIDIA DGX™ OS
尺寸 150 mm L x 150 mm W x 50.5 mm H
重量 1.2 kg