
尽管生成AI和可预测的AI的浪潮越来越高,但这些类型的工作负载变得更加丰富和复杂,对AI服务器性能和能源效率的需求也会提高。每当我们谈论AI服务器,AI工作站,AI多合一设备和其他设备时,许多人都会以高计算强度对AI GPU加速器做出反应。它确实是整个AI系统的对手,并且执行了最糟糕的任务,但不要忘记GPU加速器不能仅靠整个系统,并且如果没有CPU处理器的位置,就无法完成任何计算系统。作为任何计算系统的中心和大脑,CPU处理器在AI系统中也起着不可替代的作用,但它们总是相对较低。如果GPU加速器是AI系统中显示其技能在舞台前面的Blamelaw Star,则CPU处理器是藏在幕后和安静的风险的管家,协调E的有效操作。NTIRE系统,特别是确保可以完全满足各种GPU加速器的需求,并且可以很好地放电。因此,目前,我们通常将CPU处理器称为“主控制CPU”。 Master CPU最合适和匹配用于生产良好的AI超速系统,以在工作负载绩效与总体总成本(TCO)之间达到完美的平衡。在AI的超速系统中,Master CPU通过提供出色的任务管理和出色的预处理性能来负责处理和使用资源的处理。这对于确保AI模型培训过程中的良好数据供应并保持完美的AI处理器操作状态非常重要。作为AI超速系统的“中心神经”,CPU的主要控制可以执行各种活动,例如管理,优化,预处理,处理和加载,从而提高系统性能和能源效率。英特尔的Xeon系列处理器E特别是最新一代的Xeon系列,可以说是基于各种AI基准或全球客户扩展的实际体验的强大和高效AI加速系统的大师CPU的绝佳选择。 NVIDIA最新,最强的系统DGX B300选择了新的Xeon 6776p作为主要控制CPU,去年MGX系统使用了Xeon 6767-英特尔也是NVIDIA的CPU合作伙伴。为什么XXI 6如此强大?我们可以从六个方向查看AI加速系统对主要CPU的需求,以及Xeon 6系列如何满足它。 1。AI超速系统需要非常强大,灵活的IO性能。 Xeon 6系列最多可以支持96个PCIE 5.0频道,上一代增长了20%。双通道系统具有192个,因此带宽非常高,并且管数足够,因此可以使用不同的加速器和扩展卡进行弯曲。 2。AI加速系统需要最高的可能性单线线程表演。 Xeon 6系列不仅最高128个性能核心和大量的3级缓存为504MB,而且具有强大的性能,并且支持不同的Turbo加速技术。例如,SST可以为不同的基本调整提供不同的频率以具有不同的性能。 3。AI加速系统需要尽可能最大的内存和带宽容量。 Xeon 6系列不仅支持DDR5-6400的较高频率,而且仅支持MRDIMM内存,其频率高达8800MHz,带宽进一步增加了30%,这在上一代早些时候是2.3倍,这对于可灵敏的载荷特别有用。最多到12个内存频道,Xeon 6系列可以证明无与伦比的带宽和内存容量,具有最多支持3TB的单个系统。对于NVIDIA DGX B300系统,为每个通道选择了两个DIMM(2LDPC)和5200MHz频率方案,尤其是为了实现更大的记忆能力。此外,Xeon 6系列还支持CXL,可以保持CPU内存空间和AI加速器内存之间的一致性,实现高性能资源的共享并降低整体系统成本。 4。AI的超速系统需要CPU促进和安装数据。 Xeon 6系列支持AMX(高级矩阵扩展)指令,并增加了对FP16数据格式的支持,这适用于这项工作。特别是随着MOE和MLP模型的出现和流行,CPU上的一些工作的安装变得越来越流行。 5。AI超速系统需要强大的RAS。 RA是指可靠性,存在和维护。这是工作站,服务器和数据中心硬件的必要功能。当然,需要Xeon 6。这样,它可以大大减少大规模的停机时间并防止高损失。 RAS技术支持许多高级管理功能,包括遥测,平台监控,共享资源控制,实时固件更新等,它们汇集了平台合作伙伴的丰富专业知识和经验,ISV独立软件的开发人员以及解决方案的集成商。 6。AI超速系统需要灵活的形式。 Xeon 6系列支持全球DC-MHS标准。如果是NVIDIA MGX或DGX,则双方共同努力。最新的是DGX B300,由双方共同创建,并进行了许多技术验证工作。在Xeon 6系列家族中,有三种专门为Master CPU设计的特殊型号。它们都是基于P核心设计的,这是性能核心。当前的主要CPU控制是相同的。如果有E核心,则能量设计未来的效率,我们还应该观察到市场需求变化。其中,NVIDIA DGX B300使用Xeon 6776p和双通道调整。 Xeon 6776p配备了64个核心(128个线),2.3GHz参考频率,3.6GHz的全核涡轮增压频率和3.9GHz的最大涡轮频率。 PCT Turbo频率可在4.6GHz时运行8个核心,在传统的SKU中,它已重新提高了700MHz。此外,它配备了336MB高速缓存,并支持八通道DDR5-6400和IMM-8000的MRDANG内存,可提供88个PCIE 5.0通道,而Thermal Design则摄入350W。在这里,我们解释了许多不同的涡轮频率:所有核心涡轮是当所有芯子都活跃时可以运行的最高频率。它适用于虚拟机和其他情况。目前,每个核心都需要在性能上尽可能高。最大涡轮频率,尤其是最大涡轮增压频率是最高的涡轮频率可以在传统的skus中到达。它假设核心的一半是活跃的,而另一半是休眠的,并且活动芯可以以较高的频率运行,即对应于最大涡轮增压的频率。优先级核心管道意味着仅打开较少数量的核心,通常2-8,使它们能够进一步加速较高的频率,以满足GPU,I/O等的刺激性需求。在具有较高性能并防止系统瓶颈的AI超速系统中。至于核心用于加速,您可以在启动前使用BIOS设置,也可以在操作过程中使用SST-TF工具实时设置它。下Boil Xeon 6774p也是64个核心。除了将参考频率增加到2.5GHz外,与Xeon 6776p的最大差异是它仅支持一个通道,但最多可以提供136个IO通道,这在扩展方面更强。高端Xeon 6962p具有72个内核,144个线,432MB缓存,ANG频率参考为2.7GHz,FULL核涡轮频率也为3.6GHz,最大涡轮频率也为3.9GHz,PCT涡轮频率为4.4GHz。它还支持12个内存通道,可以提供96个PCIE通道,并且热设计功耗达到500W。以上三种产品是所有客户,产品计划和路线图计划的开放产品。将来,不会排除许多产品将根据客户的需求或客户的习俗需求推出。我只多次改善了NVIDIA DGX B300 AI加速系统。这是其总体决定。它属于高端DGX,该DGX专为AI培训等应用而设计。它配备了双通道Xeon 6776p Master CPU处理器,该处理器由UPI高速总线互连。每个通道的最高为8个PCT涡轮核。客户可以根据需要在使用时自定义并根据需求为PCT涡轮增压的8、6、4或2个核心选择。在每个强大的6776p下,四个AI GPU为C由两张NIC高速网络卡进行攻击。整个系统是八个AI GPU,它们与NVLink高速总线相互联系。在选择主CPU时,该系统采用了相对平衡的设计,但是其性能仍在领导该行业,其I/O性能,RAS性能等非常平衡,毫无疑问,它是一个不错的选择。当然,我们知道自发开发的GRACE CPU处理器被广泛用于NVIDIA AI加速系统中,以匹配AI GPU加速器。实际上,在市场上,许多AI系统提供商使用CPU开发的硕士学位与GPU联系。从Sin Intel的角度来看,其服务的方向是为客户提供更多选择,作为一个开放系统,它始终符合开放的行为,并为CPU的基本控制提供了满足客户不同需求的最佳选择。 NVIDIA DGX B300产品已选择Intel Xeon 6作为主要的CPU对照,它不是测试或测试产品,而是商业成人产品无疑是对英特尔Xeon产品的性能和兼容性的强烈认识。 [本文的结尾]如果您需要打印,请确保指示来源:Kuai技术编辑:Shangfang Wenq