首页 > 企业站 > 企业站_资讯眼> 正文

戴尔将DPU生命周期管理集成到iDRAC中

zhangxinxin 责任编辑:wangkeyue 发布于:2023-09-07 16:24

在一个由数据驱动的应用主导的时代,长期由CPU和GPU主导的传统计算格局正在经历一场范式转变。随着企业和机构进入更复杂的计算环境,特别是AI、大数据分析和云原生应用等新兴领域,对处理能力的需求发生了变化。数据处理单元(DPU)是成了新的IT要素,但企业中的DPU生命周期管理比听起来要复杂一些。

DPU,通常称为SmartNIC或基础设施处理单元(IPU),在计算(CPU)、图形(GPU)和存储网络基础设施之间发挥着关键作用。多年来,DPU部署在公有云和超大规模数据中心中,将驻留工作负载与网络、安全、存储和其他基础设施操作隔离,这些操作通常与数据中心功能相关。这种增强功能使CPU和GPU免于执行这些任务,从而使它们能够专注于计算和渲染的主要功能。英伟达首席执行官黄仁勋曾在演讲中表示,DPU将成为未来计算的三大支柱之一,未来的数据中心标配是“CPU+DPU+GPU”。CPU用于通用计算,GPU用于加速计算,DPU则进行数据处理”。

引入DPU也带来了一系列新的挑战——尤其是如何对这些单元与现有基础设施进行管理、优化和确保无缝运行。DPU管理变得至关重要,因为它引入了一个新的复杂性层。恰当的管理确保DPU充分利用它们的全部潜力,从而提供减少延迟、增加吞吐量以及更好的整体系统效率等好处。

热衷DPU支持背后感的驱动力

与DPU硬件相关的专有、特定于供应商的软件的集成让任务变得更加具有挑战性,VMware早已经利用DPU带来了性能改进。

早在2022年,VMware推出了在DPU上运行vSphere的功能(以前称为“Project Monterey”),该功能在第一个版本中特别允许vSphere 8将网络和NSX安全服务卸载到NVIDIA BlueField等DPU。这释放了主机上的CPU周期,可以用来扩展到更大的工作负载,这些工作负载与网络处理任务隔离运行,以实现最高的应用程序性能。这种工作负载整合使数据中心能够以更小的硬件占地面积、更低的功耗以及更低的资本和运营成本运行。

如今DPU,已经是企业级工作负载平台 vSphere 8的一个基本组成部分。VMware在vSphere 8上运行一个REDIS键值存储,发现启用DPU的主机实现了与未启用DPU的主机相似的性能,但CPU核心减少了20%。在另一项测试中,启用DPU的主机实现了36%的吞吐量提升和27%的事务延迟降低。

由于VMware的推动,对DPU的兴趣不断增长,这意味着客户能够使用他们虚拟化堆栈实现通常与云数据中心相关的数据中心效率水平。戴尔等供应商不得不设法将DPU也纳入设计中,同时不忘DPU生命周期管理。问题是,DPU本质上是自己的计算机,管理设计是通过以太网或其他管理端口本地完成的。但这不是企业想要的管理硬件生命周期的方式,因此当戴尔采用DPU时,他们不得不发挥一点创造力。

Dell PowerEdge、DPU和iDRAC
 
当查看NVIDIA BlueField DPU的端口侧时,它看起来就像一个标准的NVIDIA ConnectX网卡,带有一个用于管理的额外以太网端口。但是,正如前面所指出的,企业希望能够通过一个通用的生命周期管理控制台来管理所有服务器组件。对于戴尔来说,这意味着iDRAC。因此,戴尔必须发挥一点创造力,才能使硬件连接满足iDRAC识别DPU的要求。

DPU本身就像任何PCIe卡一样,简单地插入到Riser(具体来说是Riser 1A Slot 2)中。这为DPU提供了电力,并使其连接到系统总线。但是,无法像GPU那样通过PCIe对卡进行管理,至少目前不能。需要的是一个额外的硬件元素来连接这些点。在下面的R750主板的照片中,敏锐的人会注意到,在LOM(NIC)通常所在的插槽中插入了不同的卡。

当我们仔细看一下管理接口卡(MIC)时,我们可以看到它位于板载LOM通常所在的区域。MIC启用DPU和服务器BMC之间的网络控制器边带接口(NC-SI)。

使用iDRAC进行DPU生命周期管理

有几个工具可以帮助您充分利用DPU技术。Dell的集成Dell远程访问控制器(iDRAC)是专为Dell PowerEdge服务器设计的全面管理工具。它提供先进的功能,用于远程服务器监控、管理和控制。

提供实时服务器健康参数监控,让管理员能够监控CPU、内存、存储、电源和温度等关键组件。简化了固件更新,包括BIOS、RAID控制器和网络适配器。这个集中式界面让管理员管理和部署多个服务器上的固件更新,确保一致性并减少手动工作。

由于用于MIC交换的LOM和额外的电缆硬度,Dell可以通过iDRAC管理DPU,使DPU生命周期管理与PowerEdge服务器中的所有其他关键组件保持一致。虽然对于iDRAC管理员来说这看起来很简单,但为DPU带来这种易于管理性的幕后工作令人印象深刻。

最终思考

现在说每个VMware vSphere或vSAN节点都应该配置DPU以利用vSphere分布式服务引擎还为时过早,但很难忽视其中的优势。随着现代工作负载的数量和复杂性不断增加,以及对新的软件定义服务的需求,服务器CPU资源紧张,用于处理工作负载的计算周期越来越少。DPU已经广泛部署在超大规模运营商中,以处理更多的基础设施功能,并释放CPU周期以用于创收工作负载。

尽管DPU对vSphere的好处是显而易见的,但是将新的加速器引入服务器会带来必须解决的新挑战,即DPU生命周期管理。由于戴尔的创造性工程,DPU可以连接到本机BMC,并通过传统的生命周期工具(如iDRAC)进行管理。这在数据中心采用新技术方面有着显著的意义,应该会减轻DPU对戴尔客户的采用压力。

DPU   戴尔   iDRAC
zhangxinxin

网友评论

聚超值•精选

相关推荐 手机 笔记本 影像 硬件 家居 商用 企业 出行 未来
二维码 回到顶部