NVIDIA Quadro RTX5000
NVIDIA Quadro RTX5000
NVIDIA Quadro RTX5000
NVIDIA Quadro RTX5000
NVIDIA Quadro RTX5000
NVIDIA Quadro RTX5000
NVIDIA Quadro RTX5000
NVIDIA Quadro RTX5000
价格:电话咨询

        名称:NVIDIA Quadro RTX5000(英伟达  RTX5000 专业图形显卡 )全球首款光线追踪GPU

Turing GPU

3,072 NVIDIA CUDA 核心

384 NVIDIA Tensor核心

48 NVIDIA RT 核心

16GB GDDR6 内存

高达 448GB/s 显存带宽

62T RTX-OPS

8 Giga Rays/s 光线投射

11.2 TFLOPS FP32 效能

22.3 TFLOPS FP16 效能

178.4TOPS INT8 效能

89.2 TFLOPS Tensor运算

最大功耗:265W

4x DisplayPort 1.4

1x VirtualLink

产品介绍

特色与介绍


NVIDIA Quadro RTX5000(中文名:英伟达 quadro rtx5000 专业图形显卡 )

全球首款光线追踪GPU让 NVIDIA Quadro RTX 5000 打破所有可能性的界限。它建立在 NVIDIA Turing 架构和 NVIDIA RTX 平台,融合了光线追踪,深度学习,和高级着色,加强了下一代的工作流程。创意和技术专业人士可以更快的做出更明智的决策,轻松应对严苛的设计和可视化工作流程。

新的 RT 核心和Tensor核心为数百万设计和创意专业人士带来即时光线追踪和人工智能加强工作流程的强大功能。RTX 5000 结合了 NVIDIA NVLink 技术,可扩展绘图内存和效能以驱动最严苛的成像,人工智能,和视觉计算工作负载。全新的 VirtualLink 提供与下一代高分辨率 VR 头戴式显示器的链接,让您在最难以抗拒的虚拟环境中查看您的作品。欢迎来到专业视觉运算的未来。

为专业人士打造

NVIDIA Quadro RTX5000 

1. NVIDIA NVLink

NVIDIA RTX5000用高速互连方式连接两个 GPU,将内存容量扩展到 32 GB,并以 50 GB/s 的资料传输率提供更高效能。

2. 次世代内存

NVIDIA rtx5000配备 16GB 超高速 GDDR6 内存,可储存庞大的资料集 – 复杂的产品的设计,建筑模拟,媒体素材等。

3. NVIDIA Turing GPU 架构

NVIDIA Turing 配备用于光线追踪的全新 RT 核心,用于人工智能的 384 个 Tensor核心,以及用于并行运算的 3072 个 CUDA 核心,是世界上最先进的绘图处理器。

4. VirtualLink

业界首创的 VirtualLink 用来简化现有及下一代的高分辨率 VR 头戴式显示器的连接。


性能特点

Turing GPU 架构

Quadro RTX 5000 GPU 由最先进的 12nm FFN (FinFET NVIDIA) 高性能制程制造,为 NVIDIA 订做,包含 3072 个 CUDA 核心,为专业桌面上针对 HPC,AI,VR 和绘图工作负载最强大的运算平台。Turing GPU 架构实现了自 NVIDIA 在 2001 年发明可程序化着色器以来,电脑即时绘图成像最大的跃进 。它在 545 平方公厘的尺寸上整合了 136 亿个电晶体,可提供超过 11.2 TFLOPS 单精度(FP32),22.3 TFLOPS 半精度 (FP16),44.6 TOPS 整数精度 (INT8),以及 89.2 TFLOPs Tensor运算能力,完美支持各种计算密集的工作负载。

RT 核心

新的硬体光线追踪技术让 GPU 首次实现即时产生电影品质般逼真的对象和环境,包括精确的物理阴影,反射,和折射。即时光线追踪引擎与 NVIDIA OptiX,Microsoft DXR,和 Vulkan API 配合,提供远超出传统成像技术所能达到的真实程度。RT 核心使用通过像素投射少量光线来加速边界体积层次 (BVH) 遍历和光线投射功能。

加強的Tensor核心

新的混合精度核心为了深度学习矩阵运算而设计,训练时可提供前一代 8 倍的 TFLOPS。Quadro RTX 5000 利用 384 个Tensor核心,每个Tensor核心每个时脉可执行 64 个浮点融合乘加 (FMA) 运算,每个 SM 每个时脉可执行总共 1024 个独立的浮点运算。除了支持 FP16/FP32 矩阵运算,新的Tensor核心针对矩阵运算增加了 INT8 (每个时脉 2048 个整数运算) 和实验性的 INT4 和 INT1 精度模式。

先进的着色技术

网格着色:基于运算的几何管线,以加速几何复杂模型和场景的几何处理和剔除。网格着色对于受限于几何能力的工作负载提供高达两倍的效能提升。可变速率着色 (VRS):根据场景内容,注视方向,和动作来改变着色速率,以提高成像效率。可变速率着色提供相似的影像品质,但着色的像素减少 50%。材质空间着色:对象/材质空间着色可提高像素着色繁重的工作负载效能,如景深和动态模糊。材质空间着色对于像素着色繁重的 VR 工作负载,重复使用预先着色材质像素,以提高吞吐量,增加逼真程度。

高效能 GDDR6 记忆体

Quadro RTX 5000采用 Turing 的高度优化 16GB GDDR6 记忆体子系统,具备业界最快的绘图记忆体 (448 GB/s 峰值频宽),为专门处理大型数据集并对延迟敏感的应用程序理想平台。Quadro RTX 5000 提供比前一代增加 50% 的记忆体频宽。

NVIDIA GPU BOOST 4.0

自动最大化应用程序效能,而不会超出卡的功耗和散热范围。允许应用程序在更高温下停留在加速时脉状态更久,才会再降到第二温度设定的基本时脉。此功能需要软件应用程序来启动,而不是独立的程序。关于可用性的细节请联络 quadrohelp@nvidia.com。 

先进串流多处理器 (SM) 架构

结合共享记忆体和 L1 快取以大幅提高效能,并简化程序和减少所需的调整来得到最佳的应用程序效能。每组 SM 包含 96 KB L1/共享记忆体,可根据运算或绘图工作负载,配置各种容量。对于运算工作,最多可分配 64 KB 到 L1 快取和共享记忆体,而绘图工作负载最多可分配 48 KB 到共享内存;32 KB L1 和 16 KB 材质单元。 结合 L1 快取和共享内存可降低延迟并提供更高频宽。


混合精度运算

16 位浮点精度运算,可将吞吐量加倍并降低储存需求,实现更大型神经网络的训练和部署。Turing SM 具备独立的平行整数和浮点资料路径,对于运算和地址计算混合的工作负载更有效率。

错误修正码内存 (ECC)

英伟达 NVIDIA quadro RTX5000符合关键性任务应用程序对资料完整性的严格需求,为工作站提供无可比拟的计算精确度和可靠性。

图形抢占

像素等级抢占提供更细微的控制,对时间相关的工作支持更佳,例如 VR 动态追踪。

计算抢占

指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。

H.264 和 HEVC 编码/解码引擎

两个专属的 H.264 和 HEVC 编码引擎以及独立于 3D/运算管线之外的解码引擎可提供比即时更快的转档,影片编辑,和其他编码应用程序效能。

单一指令,多执行绪 (SIMT)

新的独立执行绪排程功能可在小型工作间共享资源,实现平行执行绪之间更精细的同步和合作。

 

多 GPU 技术

NVIDIA NVLink

NVLink 连接两张 Quadro RTX 5000 将有效可用显存加倍,并可利用高达 25GB/s (双向) 的 GPU 对 GPU 资料传输率将应用程序效能扩张 ,总频宽可达 50 GB/s。

NVIDIA SLI 技術

英伟达 RTX5000利用多个 GPU 动态扩展绘图效能,加强影像品质,扩大显示空间, 并加速 VR 成像。

利用 NVLink 技术扩展应用程序效能

NVIDIA Quadro RTX5000 

影像质量

NVIDIA Quadro RTX5000 

全景反锯齿 (FSAA)

NVIDIA rtx5000使用高达 64X FSAA (SLI 模式下 128倍) 大幅降低视觉混叠伪像或「锯齿」以获得优秀的影像品质和极为逼真的场景。

32K 材质和成像处理

材质来自并成像到 32K x 32K 表面以支持需要最高分辨率和品质的影像处理应用程序。


显示特性

VirtualLink

新的开放式业界标准连接性,适用于下一代 VR 头盔,提供四个高速 HBR3 DisplayPort 通道,USB3.1 资料通道和高达 27 瓦的供电。USB-C 的备用模式针对延迟和频宽需求进行优化,以提供更高的显示分辨率,并采用高频宽相机,在 VR 头盔上用于追踪和扩增实境。

Multi-View

可一次产生四个独立画面,大幅降低绘图管线工作负载并提高真实感。同步多重投影 (SMP) 引擎比上一代的投影中心加倍,可执行多达两倍的几何成像工作负载。这可让与位置无关的画面具有更大灵活性,产生更多创意场景。

DisplayPort 1.4

NVIDIA quadro RTX5000支持最多四个 5K 显示器 @ 60Hz,或每卡两个 8K 显示器。Quadro RTX5000 支持 HDR 色彩,包括 4K @ 120Hz 10/12b HEVC 解码以及高达 4K @ 60Hz 10b HEVC 编码。 每个 DisplayPort 连接头可驱动 4096x2160 @ 120 Hz 的超高分辨率及 30-bit 色彩。

最大效率模式

资料中心可利用全新的最大效率模式,在现有的功率分配中,达到每机架提高 40% 的运算容量。在此模式中,Tesla V100 会以尖峰处理效率运行,以减半功耗提供高达 80% 的效能。

NVIDIA Mosaic 技术

将桌面和应用程序从单一工作站扩展到最多 4 个 GPU 和 16 个显示器,同时提供完整的效能和影像品质。

NVIDIA Quadro Sync III

在单一系统的 8 个 GPU 中同步最多 32 个显示器的显示和画面输出 (透过两张 Sync II 卡连接),减少建立高阶影像可视化环境所需的机器数量。

NVIDIA Quadro RTX5000 

NVIDIA nView 进阶桌面软件

在单一大型显示器或多显示器环境下让终端用户对桌面体验取得前所未有的的控制,以提高生产力。

框页锁 (Frame Lock)

每个框页锁连接器都设计有自动锁定保持机制,以确保与框页锁定排线的连接,提供强大的连接性和最高的生产力。

OpenGL 四缓冲立体支持

英伟达Quadro RTX5000为专业应用程式提供流畅与身历其境的 3D 立体体验。

支持超高分辨率桌面

在最大 32K 桌面大小的高分辨率显示器上获得更多 Mosaic 拓扑选择。

专业 3D 立体同步

稳定控制三维效果,经由专属连接直接将 3D 立体硬件同步到 Quadro 显卡。


软件支持

针对 Turing 优化的软件

深度学习框架例如 Caffe2, MXNet, CNTK, TensorFlow 等可以大幅加快训练时间并提高多节点训练效能。GPU 加速函式库如 cuDNN, cuBLAS, 和 TensorRT 为深度学习推理和高速计算(HPC)应用程序提供更高的效能。

NVIDIA CUDA 平行运算平台

原生执行标准程序语言如 C/C++ 和 Fortran,以及 API 如 OpenCL,OpenACC 和 Direct Compute,以加速光线追踪,影片和影像处理,以及流体力学计算等技术。

单一内存

单一无缝的 49 位虚拟地址空间可让资料在 CPU 和 GPU 完全分配的内存内透明的移动。

NVIDIA GPUDirect for Video

GPUDirect for Video 经由避免不必要的系统内存资料复制和 CPU 负担来加速 GPU 和影像 I/O 装置间的沟通。

NVIDIA 企业管理工具

将系统正常运作时间最大化,无缝管理大规模部署并远端控制图形和显示设定,以实现高效率运作。

NVIDIA Quadro RTX5000 

NVIDIA 包装及配件

NVIDIA Quadro RTX5000

Quadro RTX 快速入门指南

Quadro 支持手册

1 DisplayPort 转 DVI 转接头

1 DisplayPort 转 HDMI 转接头

1 辅助电源线(8-pin 转双 6-pin 转接器)


规格

GPU 架构

Turing

NVIDIA CUDA 核心数量

3072

NVIDIA Tensor 核心数量

384

NVIDIA RT 核心数量

48

GPU 内存

16 GB GDDR6

RTX-OPS

62T

光线投射

8 Giga Rays/Sec

最高单精度 (FP32) 性能

11.2 TFLOPS

最高单精度 (FP16) 性能

22.3 TFLOPS

最高整数运算 (INT8) 性能

178.4 TOPS

深度学习 TeraFLOPS1

89.2 TFLOPS

显存位宽

256-bit

显存带宽

448 GB/s

最大功耗

265 W

总线

PCI Express 3.0 x16

显示接口

DP 1.4 (4) + VirtualLink (1)

尺寸

4.4” 高 x 10.5” 长 双槽

重量

972 g

散热方案

主动式

NVIDIA 3D Vision 和 3D Vision Pro

由 3 pin mini DIN 支援

框页锁(Frame Lock)

相容 (与 Quadro Sync II)

NVLink 互连技术

50 GB/s

1 FP16 矩阵乘以 with FP16 或 FP32 累加

 

支援平台

Microsoft Windows 10 (64 位元)

Microsoft Windows 8 and 8.1 (64位元)

Microsoft Windows 7 (64 位元)

Linux® - 完整 OpenGL 实作,完整 NVIDIA 和 ARB 延伸 (64 位元)

 

3D 绘图架构

可扩充式几何坐标 (Scalable geometry) 架构

硬件细分曲面引擎 (Hardware tessellation engine)

NVIDIA GigaThreadTM 引擎及 5 个异步复制引擎

Shader Model 5.1 (OpenGL 4.5 和 DirectX 12)

高达 32K x 32K 纹理及着色处理

透明多重取样和超级取样

16 倍速角度独立式非等方性过滤技术

32-bit 纹理过滤及混色技术的浮点能力

64 倍速全景抗锯齿 (FSAA) 技术 / SLI模式可达128倍

硬件译码加速支持 MPEG-2, MPEG-4 Part 2 Advanced Simple Profile, H.264, HEVC, MVC, VC1, DivX (version 3.11 及更新版本), 以及 Flash (10.1 及更新版本)

专属的 H.264 及 HEVC 编码器2

Blu-ray 双串流硬件加速 (支持 HD 子母画面播放)

NVIDIA GPU Boost (自动提高 GPU 引擎吞吐量以最大化应用程序效能)


NVIDIA CUDA 并行处理架构

每个 SM 的新 RT (光线追踪) 核心

Turing SM 架构 (串流多处理器设计,提供更高处理效率)

动态并行 (GPU 动态生成新线程而无需返回 CPU)

混合精度 (1, 4, 8, 16, 32 和 64 位) 计算

API 支持包括:CUDA C, CUDA C++, DirectCompute 5.0, OpenCL, Java, Python, 和 Fortran

绘图内存上的错误修正码 (ECC)

可配置多达 96 KB 的内存 (每个 SM 的专属共享内存大小)

 

显示特性

支持四个显示器的任意组合

四个 DisplayPort 1.4 输出 (支持分辨率如 3840 x 2160 @ 120 Hz, 5120x2880 @ 60Hz 和 7680 x 4320 @ 60Hz)

DisplayPort 转 VGA, DisplayPort 转 DVI (single-link 和 dual-link) 和 DisplayPort 转 HDMI 扁平电缆 (支持分辨率依照转接器规格而定)

DisplayPort 1.4 (SMPTE 2084/2086, BT. 2020) (4K @ 60Hz 10b/12b HEVC 译码, 4K @ 60Hz 10b HEVC 编码) 支持 HDR

DisplayPort 和 HDMI 连接头支持 HDCP 2.2

12 位内部显示管线 (搭配支持的面板,应用程序和连接,硬件支持 12 位扫描输出)

支持 NVIDIA 3D Vision技术,3D DLP,交错,和其他 3D 立体规格

支持完整 OpenGL 四缓冲立体技术

欠扫描/过扫描补偿和硬件缩放

NVIDIA nView 多显示器技术

利用 NVIDIA SVS 平台,包含 NVIDIA® Mosaic, NVIDIA Sync 和 NVIDIA Warp/Blend 技术,支持大规模和超高分辨率可视化

 

DisplayPort 和 HDMI 数字音效

支持以下声音模式:- Dolby Digital (AC3), DTS 5.1, 多声道 (7.1) LPCM, Dolby Digital Plus (DD+),和 MPEG-2/MPEG-4 AAC

支持DisplayPort 数据传输率 48 KHz

支持16-bit, 20-bit, 以及 24-bit 大小字符组

Mini-DisplayPort 连接器采用订制卡榫固定装置设计,可牢牢固定显示器连接线。

2 此功能需要软件应用程序来启动,而不是独立的程序。关于可用性的细节请联络 quadrohelp@nvidia.com。

 


相关推荐

NVIDIA QuadroRTX 6000

价格:电话咨询

NVIDIA Quadro RTX5000

价格:电话咨询

NVIDIA Quadro P6000

价格:电话咨询

NVIDIA Tesla T4

价格:电话咨询