智算市场迎来大爆发!AMD准备就绪携第四代EPYC为普惠AI加速

2024-03-15 来源:网络 阅读:2037

无论是ChatGPT火爆出圈,还是到AI视频生成大爆发,这背后都是在卷“算力”。特别是近年来,自动驾驶、AIGC、数字孪生等前沿技术领域的热度持续升温,这些行业对智能算力的需求似乎永无止境,其上限之高远超出我们的想象。

而要满足这些算力需求,智算中心是关键,可以为前沿技术提供强大的算力支持。

近些年,AMD在数据中心领域的不断突破和创新,不断适配市场需求升级迭代产品。作为智算中心底层核心,AMD赋能计算芯片逐步突破数据中心的极限,提供更强大的性能、效率和可扩展性,来进一步为AI赋能。

AI“热辣滚烫”,智算中心拔地而起痛点显现

在当前AI技术的热潮下,国内智算中心建设如火如荼。互联网巨头、通信业三大运营商纷纷加大投入,希望在智能算力中心建设中占据先机。

然而,智算中心的建设并非易事,它需要高效的计算架构、算法优化,以及计算资源的合理分配和管理。

国家工业信息安全发展研究中心发布的《智能计算中心2.0时代展望报告》(以下简称《报告》)中提到了,2022年,国家相关政策引导力度渐强,智能计算中心建设迎来行业引导2.0阶段。并提出了智算中心2.0阶段的要求,以算力多元化、产业协同化、服务一体化、能耗低碳化、价格普惠化、部署超前化、技术可信化为建设方向,实现公共算力服务、数据开放共享、产业生态创新等功能的集聚。

尽管已经取得了一些进展,但智算中心等算力基础设施仍面临一系列共性问题,如多元算力设施建设尚显薄弱、算力调度标识和度量标准不统一、算力设施成本和碳排放问题等。尤其是,许多地区存在算力配置不均衡的问题,只能满足一部分细分场景的需求,无法兼顾多产业、多领域对融合算力的需求。因此,行业认为,智算中心的发展需要推动通用算力、专用算力的融合,以驱动应用向纵深发展。《报告》中也强调,需要利用CPU与GPU等加速芯片的异构重合,来实现高精度通用算力和低精度专用算力的融合供应。

即使行业普遍认为GPU是智算中心的关键,但CPU的重要性不容忽视。作为计算机行业的中枢,CPU有着不可替代的地位。它不仅扮演着核心指挥官的角色,还在不断适应时代的变化,具有无可比拟的灵活性和适应性。

在智算中心中,CPU负责协调和管理整个计算系统的运行,处理逻辑判断、通用计算等任务,确保整个计算系统的稳定和高效运行。同时,CPU还承担着为AI应用提供基础运行环境的重要职责。无论是深度学习框架、机器学习算法还是其他AI应用,都需要在CPU的基础上进行运算和推理。

AMD “双星”闪耀,打破算力瓶颈为AI加速

作为计算领域的领军企业,AMD打造出的第四代 EPYC服务器处理器突破数据中心可能性的界限,可以在通用、云原生或技术计算工作负载中提供领先的性能,为数据中心和企业级市场提供了强大的算力支持。

在智算中心建设的浪潮中,AMD第四代 EPYC系列两大明星产品——Genoa-X和Bergamo产品系列,正以其卓越的技术实力和创新能力,应对智算中心面临的多重挑战。 

高计算能力。Genoa-X凭借其超大的缓存设计,就像一个巨大的临时存储仓库,为数据处理提供了极快的存取速度。这使得它在处理需要高计算能力的任务,如复杂的数学建模、电子设计或流体动力学模拟时,表现得特别出色。Bergamo则是为了处理云服务和科学研究等特定领域而设计的,它拥有全新的高密度Zen 4c 核心,最高采用8个16核CCD总共 128 个核心、256 个线程,拥有820 亿个晶体管,兼容 x86 ISA 指令,大量的核心和线程,使得Bergamo可以同时处理很多任务;还支持最新的DDR5内存技术,使数据传输更快。

统一算力调度,运营更高效。有了超强算力之后,如何灵活、精益地为各行各业所取用呢?这就需要对多样算力进行统一的调度和运营。

无论是基于KVM的虚拟机,还是基于docker的容器以及容器编排系统。Genoa-X和Bergamo对这些上层的虚拟化技术都已经实现了完整的支持。得益于5nm 制造工艺以及全新的zen4c核心,并完整支持AVX512指令集,使得Bergamo平台在面向虚拟化的算力调度过程中如虎添翼。另外,Bergamo可以根据用户的需求灵活支持单路和双路,以降低在大型智算中心以及跨区域智算中心之间算例调度的复杂度。

同时,所有AMD 第四代EPYC服务器处理器在运行AVX-512指令运算过程中,由于使用了新的实现方式而不会产生CPU频率剧烈抖动的现象,这也为云计算用户以及应用混合部署以及相应的算力调度带了巨大的优势。

保护隐私安全。在算力的实际应用中,更好地管理风险打造安全的数据环境也及其重要。在没有使用虚拟化技术的服务器上,AMD所搭载的内存加密技术SME和TSME,能够确保即使服务器被非法访问,内存中的数据也不会被轻易读取。而在虚拟化环境中则可以使用SEV技术主要用于保护数据安全;另外,SEV的一个增强版本SEV-ES,则旨在进一步提高基于虚拟化技术的数据安全,保护敏感信息。

低碳环保是关键。智算中心也是个耗电大户,不过近年来,AMD不断加大研发等方面的投入,通过提升产品性能帮助客户更少的部署服务器并降低数据中心能耗。其中,Bergamo拥有更高处理器核心密度,更强算力,更先进的处理器架构设计有效支撑处理器的性能和功耗比,因而在服务器的整个生命周期内,给用户带来更优的TCO和性价比,成为真正绿色算力的生力军。

算力资源高效利用。Genoa-X和Bergamo系列可以助力提高算力利用高效率,两个系列可以实现相互兼容,不需要来购买不同主板,这样既节省了硬件成本,又使得服务器的维护和升级更加简单。当有更换CPU的需求时,也无需进行复杂的硬件调整或重新配置,只要更新服务器基本输入输出系统,服务器就可以识别新安装的CPU并正常启动。

行业评价称,AMD第四代EPYC堪称当今世界上最强大的通用处理器,更是几乎在每个角度都没有对手。

智算中心遍地开花,AMD 加速AI普惠化

纷纷崛起的智算中心,带来了智算规模的强劲增长。

国家发改委对智能算力的发展提出了明确目标。到2025年年底,中国将初步形成普惠易用、绿色安全的综合算力基础设施体系。同时,东西部之间的算力协同调度机制将逐步完善,这将有助于实现通用算力、智能算力、超级算力等多元算力的加速集聚,从而为各类AI应用提供更加强大和高效的支持。

IDC数据显示,预计2023年中国人工智能服务器市场规模将达到91亿美元,同比增长82.5%,2027年将达到134亿美元,年均复合增长率为21.8%,中国AI服务器市场规模增速高于全球平均水平。

业内人士表示,随着算力需求暴涨,国内智算中心多地开花,产业链上下游都迎来发展新机遇,尤其是芯片市场迎来“春天”。

以AMD为例,作为计算领域的领军企业,AMD积极拥抱AI。AI不仅是一项炫酷的新技术,更预示着计算领域未来的巨大变革。面对巨大的市场潜力,AMD不断升级迭代产品性能;同时还不断深化与产业合作。

AMD的技术广泛应用在金融、电信、制造、教育和医疗等各行各业,其中AMD EPYC(霄龙)系列处理器凭借行业领先的架构、效率、AI性能以及安全特性,正在高效赋能电信运营商。

在海外,爱立信和澳洲电信正采用第四代 AMD EPYC 处理器,为创新的 5G 核心网功能提供能源效率与实现现代化。爱立信表示,通过为爱立信的云原生基础设施解决方案( CNIS )提供支持,并结合爱立信的分组核心网关和分组核心网控制器解决方案,AMD EPYC CPU 提供了高达 49% 的功耗下降。 

俗话说,机会都是给有准备的人。如今,智算中心迎来发展高速期。基于敏锐的市场洞察,AMD在2024年持续将重点面向数据中心市场,特别是在人工智能(AI)和机器学习(ML)这两个对于现代智算中心至关重要的领域中;这不仅反映了AMD对市场需求的深刻理解,也显示了其在智算中心高速发展的机遇期而做的准备。

随着各类新应用场景的出现,全社会也对算力资源也提出更高要求。AMD也将在未来发展过程中,不断推陈出新,以更先进的技术和更优质的产品,为全社会提供更为强大的算力支持,来共同迎接数字化时代的新挑战,为AI未来全面加速。


内容转载自运营商财经


延伸 · 阅读