正在阅读:向AI全速进发 NVIDIA的数据中心野望向AI全速进发 NVIDIA的数据中心野望

2019-03-20 00:15 出处:PConline原创 作者:张垞 责任编辑:zhangcha1

  由NVIDIA举办的GTC 2019今日在美国加州圣何塞正式开幕。与之前的几届GTC一样,今年,与AI和HPC相关的数据中心业务同样是NVIDIA创始人兼CEO黄仁勋在主题演讲中所关注的重点领域。显然,相对于日渐萎靡的消费级游戏市场,数据中心业务正在成为NVIDIA关注的重点。

  一站式AI优化库——CUDA-X AI

  在开场例行的“秀画面”环节之后,黄仁勋终于宣布了本次GTC的重头戏——CUDA-X AI库。

老黄眼中的PRADA,你get到了吗

  CUDA,Compute Unified Device Architecture,是由NVIDIA所推出的一个类C开发环境,其主要目的是帮助开发者更好的使用GPU的并行计算能力,从而获得更好的软件运行效率。而本次推出的CUDA-X AI则是多种面向不同类型工作负载的经过优化的运行库的集合,运行在CUDA之上。按照NVIDIA官网的信息,CUDA-X AI包括加速深度学习算法的粗DNN、加速机器学习的cuML、加速数据科学中常用的pandas及类似框架的cuDF、用于执行高性能图表分析的cuGraph、用于加速基于模型的推理的TensorRT等一系列加速库的集合。CUDA-X AI目前所包含的加速库数量为18个。不过相信随着GPU应用领域拓宽和新框架的不断出现,CUDA-X AI的内容也会变得原来越多。目前,CUDA-X AI所包含的内容也都已经针对最新推出的Tensor Core GPU进行了适配和优化。

  在过去,GPU用户在应对不同工作负载时需要单独安装不同的加速库,这显然相当麻烦;而CUDA-X AI的出现则会大幅简化这些前期的安装及配置工作,让开发者能够更专注于代码。

CUDA-X AI生态系统

  目前,CUDA-X AI已经在包括Charter、Paypal、沃尔玛、微软等用户中实际部署,而包括浪潮、曙光、联想、HPE、戴尔EMC、思科、富士通等在内的7家系统设备供应商也推出了内置CUDA-X AI的硬件产品。

  执着于造系统的半导体企业

  与其他半导体企业几乎不碰终端系统不同,NVIDIA似乎特别乐于推出自己的硬件系统。从2016年的GDX系统到2017年的HGX,再到后来的GDX-2和HGX-2,NVIDIA不仅在持续更新自己的整机系统,更有着不断大型化的趋势。而今天的GTC 2019上,NVIDIA更是推出了更大规模的RTX SERVER POD。

加了存储、网络和控制节点的RTX SERVER POD,相当壮观

  RTX SERVER POD是一种基于模块化设计的服务器堆栈,其设计思路相当有意思。

RTX SERVER节点所采用的刀片设计

  从总体上看,一个满配的RTX SERVER POD是一个庞大的横向扩展服务器集群。这一集群由32台RTX Server组成,而每台RTX Server则又分为两个4U节点。在节点设计上,RTX Server node参考了刀片的设计思路,4U机框内可以安装10个RTX刀片,每个刀片内置两块RTX计算卡(GPU为Tesla T10,还包括一个Intel酷睿i9八核心处理器,32GB系统内存以及256GB的NVMe SSD,最大功耗450W。)。单个RTX Server接近300公斤,最大功耗10Kw。整个RTX SERVER POD内部采用Mellanox的Infiniband网络进行节点间互联,节点内部的GPU之间则使用NVLink互联。

  这种层层嵌套的系统有利于大规模快速部署并且易于升级和维护,主要面向云游戏、大规模视频渲染、云计算等应用场景。

  不难看出,随着NVIDIA在数据中心市场上的野心不断增大,其推出的系统规模也是一路上涨,从目前的发展来看,二者成正比关系(按照这一趋势发展下去,2020年的GTC不知NVIDIA会推出怎样规模的硬件系统)。

  不忘在终端应用上发力的NVIDIA

  在可以想见的未来,AI应用必将无处不在。但现实的问题却是如果想要真正普及AI(至少是目前这种以深度学习或机器学习为基础的AI)就必须在终端与云端之间建立更高的数据传输带宽,以应对高规格传感器所产生的大量数据,而这显然意味着更高的网络和使用成本。为了解决这一问题,NVIDIA给出的答案便是边缘计算。

Jetson系列及其特性

Jetson Nano及其开发套件,99刀不含税

  在本次GTC 2019上,NVIDIA针对边缘计算、机器人等应用场景推出了Jetson Nano系列终端计算卡以及对应的开发套件。这些套件能够以相对低廉的价格和功耗帮助AI终端开发者进行产品研发。黄仁勋在介绍时表示,Jetson Nano不仅拥有出众的效能,更提供了对CUDA-X AI运行库的完整支持。

  NVIDIA的未来

  从最初的显卡公司到现在的计算公司,NVIDIA成功抓住了并行计算和异构计算崛起所带来的巨大红利。而随之而来的AI和HPC市场也为NVIDIA带来了巨大的利润。对数据中心市场的重视也就成为NVIDIA和黄仁勋本人顺理成章的选择。虽然我们没能在本次GTC上看到革命性的GPU核心,但NVIDIA显然向世人展示了新一代半导体强者所应有的气场和远见。

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

网络设备论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品