突破容器化瓶颈,AMD EPYC 开启数据中心新篇章

2024-03-15 来源:网络 阅读:2016

千行百业正在加速数字化、云化,这一切都对传统计算基础架构提出新挑战。

以“容器化”为核心的改造,凭借出众的敏捷性和效率,成为基础设施升级的重要途径。

Gartner预测,到2027年,全球超过90%的企业用户将在生产环境中运行容器化应用,25%的企业应用将在容器上运行。

不过,在容器化场景中,为了实现更佳的敏捷性、弹性、高性能和高效率,仅仅依靠软件优化并不够,还需要更为强大的硬件设施提供底层支持。

直面容器场景 “碎片化” 痛点

在容器化环境中,尤其是广泛采用Kubernetes(K8s)进行资源管理时,多容器协同工作成为业务常态,而CPU资源的碎片化成为一个普遍存在的痛点。随着容器化应用程序的自动管理、部署、扩展以及升级时,这一问题变得尤为突出。

具体来说,当主机拥有一定数量的CPU核心时,如果容器规格多样且混合部署,系统往往难以完美满足所有容器的资源需求。例如,在6个核心的主机上,若存在4个需要1CPU的容器和2个需要2CPU的容器,即便所有核心都被使用,也会出现因无法提供连续空闲核心而导致某些容器无法被调度的情况。这时就会出现难以充分利用的碎片空间,这些空间如同孤岛,虽然存在于系统中,但无法被有效整合利用,导致了CPU资源利用率的降低。

这种单机CPU资源不足的问题不仅影响了资源利用率,还对系统的稳定性和扩展性带来了挑战。如果需要增加容器或应用时,必须非常谨慎地计算和调整资源分配,以避免资源不足或过度分配的情况。这不仅增加了管理的复杂性,还限制了集群的扩展能力。

为了解决这一问题,提升硬件规格成为一种有效策略,因为更多数量的核心意味着更高的资源灵活性和更低的碎片化风险,使得系统在部署和管理容器时能够更加高效和稳定。例如拥有更多核心和线程的AMD EPYC 9654系列处理器,可以显著增强主机的资源池,从而更好地满足各种规格容器的需求,有效提升容器化环境的整体性能和稳定性,将成为数据中心未来的升级方向。

EPYC 9654凭什么成为数据中心顶流?

当企业级应用走向云端并需要进一步提高服务器效率时,容器化就成为了必然趋势, Docker和K8s等,也逐渐成为企业级应用部署和管理的核心手段。AMD支持容器化的方式有很多种,而将其处理器优势带入容器化生态系统中,则能够从底层提供有力支持。

近年来,在服务器和数据中心等企业级市场,AMD EPYC系列处理器发展势头迅猛,在容器环境中的性能表现和可扩展性服务也获得了业界的高度关注。2022年11月,AMD推出了全新的第四代EPYC处理器(选用EPYC 9004作为产品基础代号),以其高主频、高核心密度、低延时高吞吐的内存 访问、高性价比等优点,成为首批国内容器解决方案首选的CPU,并在国内率先实现了容器方案落地。

AMD第四代EPYC处理器分为四个不同子系列,应用领域和场景各具针对性:

其中,以EPYC 9654为旗舰代表的AMD EPYC 9004系列适应性最强,可广泛用于通用服务器与数据中心;Genoa-X EPYC 9004X系列加入了AMD独有的3D V-Cache堆叠缓存,是世界上首个采用3D芯片堆叠缓存的数据中心处理器,缓存合计可达1152MB,可满足对极强计算性能的需求;Bergamo EPYC 9704系列首次采用精简版的Zen 4c架构,面积更小,能效更高,适合需求超高计算密度的云原生领域;Siena EPYC 8004系列同样是Zen 4c架构,主打基础设施和智能边缘计算领域。

第四代EPYC数据中心处理器拥有卓越的数据中心性能、领先的能源效率、优秀的TCO表现、安全的加密计算能力以及丰富的生态系统。

从已知的信息和规格来看,EPYC 9004系列处理器确实代表了当前最先进的企业级产品之一:首先是拥有先进的单核心性能和单插槽性能,依靠Zen 4架构和5nm工艺实现;其次是配备超大的内存带宽和容量,主要依靠12通道的DDR5内存来实现;第三是采用全新的I/O接口,包括最大160通道的PCIe 5.0控制器、以及可以利用CXL协议扩展的内存寻址功能等;第四则是加密计算方面的新进展,主要通过CXL以及2倍的SEV-SNP功能来实现。

从整体布局来看(如下图),EPYC 9004依旧采用了AMD大获成功的Chiplet设计,中间是全新设计的I/O芯片,周围的CCD单元数量增加到12个,这也是EPYC 9004核心数量大增的主要原因。每个CCD包含8个CPU核心和相应的缓存,以及32MB L3缓存。

▲ AMD EPYC 9004的宏观布局

架构方面,EPYC 9004采用Zen 4,AMD希望新架构能够实现更高的性能、更低的延迟和更好的能效比。在Zen 4架构中,性能的提升主要来自频率和IPC提高;更低的延迟主要是提升了缓存的性能并降低了整个架构的平均延迟;能效比方面则通过新设计、新工艺以及将移动端的一些技术移植在桌面端,从而降低了整个CPU的动态功耗。

▲ Zen 4架构相比Zen 3架构的重要提升

在AMD第四代EPYC处理器中,EPYC 9654是旗舰产品,单颗CPU的核心指标为: 支持96核心,开启SMT可支持192线程;最高主频3.7GHz;最大支持1152MB L3 cache(9654X);可支持12个内存通道。

这些能力也使它拥有了轻量级虚拟化场景下的绝对优势,正如前文所述,出色的核心数量和大内存容量,使它成为k8s系统的理想之选,使得k8s调度时可以极大降低整机的碎片化率。

要强调的是,AMD EPYC 9654支持组建双路系统,为用户打造192核心、384线程多核心的超多核心计算系统创造了条件,对那些亟需多线程运算性能的渲染与模拟、科学仿真用户颇具吸引力。

此外,在AI类容器化场景下,EPYC 9654强大的AI计算能力也能够提供有效支持。基于2P处理器,《微型计算机》评测室对上一代EPYC 7003系列的顶级型号EPYC 7763和EPYC 9654进行了评测,两款处理器参数规格和测试对比如下:

▲ 参测处理器规格一览

可以看到,在科学计算场景测试NAMD、AI计算场景测试HPL and DGEMM以及内存带宽测试,EPYC 9654对比上一代EPYC 7763,几乎都是翻倍的性能表现。

(1)科学计算场景测试中,NAMD是一种并行的分子动力学代码,由伊利诺伊大学厄巴纳-香槟分校贝克曼高级科学与技术研究所的理论和计算生物物理学小组开发,它主要用于大型生物分子系统的高性能模拟。本次测试中,主要通过NAMD来考察参测处理器的浮点性能,数值越小则越快,代表处理器的性能越好。

(2)HPL的英文全称为“High-Performance Linpack”,Linpack是国际上一款用于测试高性能计算机系统浮点性能的基准测试工具。通过对高性能计算机采用高斯消元法求解一元N次稠密线性代数方程组的测试,考量高性能计算机的浮点性能。可以使用AVX-512指令集运算来完成该测试,该测试数值越大,代表其处理能力越强。

(3)DGEMM是一个基于双精度矩阵乘法例行程序的快速基准测试,可计算以下乘积:C←αAB+βC。其中A、B和C是包含双精度浮点值的矩阵,而α和β是标量。AMD的开源DGEMM基准使用了AOCL 4.0的AMD BLIS组件,其结果最终会反馈出一个Gflops值,该值将接近于可实现的最大系统吞吐量。同样这个测试也可以使用AVX-512指令集运算,可以体现处理器在支持AVX-512指令集后的性能优势。该数值越大,代表其处理能力越强。

(4)Stream是业界广为流行的综合性内存带宽实际性能测量工具之一。和硬件厂商提供的理论最大内存带宽不同,通过fortran、C两种高级且高效的语言编写完成的Stream,可以在测试中充分发挥出内存的能力。Stream一共包含Copy、Scale、Add 和Triad 这四种操作,其中Triad组合了前三种操作,因此测试成绩更具参考价值。EPYC 9654采用的是12通道DDR5 4800内存系统,相对于EPYC 7763每一路系统的8通道DDR4 3200,单路内存带宽在规格上就有大幅提升(460.8GB/s VS. 204.8GB/s),因此在内存性能测试上也取得了压倒性的胜利。

除了上述测试,另据AMD官方数据,和EPYC 7763相比, EPYC 9654能够在云端、HPC和企业级性能方面分别领先107%、123%以及94%。并且在支持AVX-512后,使用2路EPYC 9654(192核心)对比2路EPYC 7763(128核心),在NLP、图像识别以及物体检测的吞吐量测试中,前者的领先幅度分别达到4.2倍、3倍和3.5倍。

第四代EPYC拉开数据中心变革序幕

今年2月,Mercury Research公布了2023年第四季度AMD处理器市场份额统计数据,无论是桌面、笔记本还是服务器数据中心,AMD处理器都在快速增长,尤其是在数据中心领域,AMD EPYC实现了强劲增长。

出货量方面,AMD EPYC占据服务器市场23.1%的份额,相较2022年第四季度同比大涨5.5%,这在历史上都是极为罕见的速度;收入方面,AMD EPYC份额达到31.1%,同比提高4.0%,环比提高了1.1%。

这些都是EPYC产品线一路升级、进化的结果,其性能、能效越来越强,从而有能力给整个行业带来更为有力的选择。就如本文所提到的EPYC 9654,采用5nm生产工艺、Zen 4架构、引入DDR5内存……这些关键创新都使它成为一款技术规格与性能得到大幅提升的处理器。可以预见的是,在接下来很长一段时间内,它都是亟需高性能、可靠性、可从容应对各种复杂IT挑战的首选之一。

对于数据中心应用来说,算力的性能、能效是核心诉求。特别是在负载都进行容器化的当下,不论是耳熟能详的微服务、在线应用,还是数据库、大数据、AI、中间件等,容器化都成为一个重要趋势。AMD EPYC不仅为云和计算工作负载提供了全新且领先的解决方案,更为未来的战略增长做好了充分准备。



内容转载自云头条


延伸 · 阅读