常用工具 医生入驻 免费问医生

历史首次!AMD服务器CPU市占率达50%

2025-08-28 15:49:47 来源:怒猊渴骥网   

直通县市两会|政协美姑县第十五届委员会第三次会议闭幕



电子发烧友网报道(文/黄晶晶)近日,历史根据市场研究机构PassMark对于服务器CPU市场占有率调查的首次U市数据显示,截至2025年一季度AMD在服务器CPU 市场市占率首次达到50%,占率与竞争对手英特尔持平。历史根据AMD的首次U市数据显示,自EPYC CPU推出以来,占率其在服务器领域的历史市场份额由2018年的2%提升到2024年上半年的34%。在持平之后未来竞争将变得更加激烈。首次U市




回看每一代AMD EPYC处理器的占率演进,它们都致力于为客户提供性能更高、历史能耗更省的首次U市CPU。2017年AMD推出基于Zen架构的占率EPYC霄龙服务器处理器Naples,一举打破了英特尔在服务器市场的历史优势,正式开启高性能计算赛场的首次U市征战。2019年基于Zen 2架构的占率第二代霄龙Rome问世,首次将7nm先进制程带入数据中心。2021年,AMD发布采用Zen 3架构的第三代EPYC霄龙服务器处理器Milan。以及后续第四代产品Genoa、Bergamo等,直到去年第5代EPYC CPU Turin将核心数推升至192核。


AMD抓住AI时代数据中心领域对高性能CPU适配GPU以及承担AI推理任务等需求,凭借核心密度、能效、性价比等优势强势崛起。

CPU适配助GPU发挥潜力

GPU 加速器已成为现代 AI 的主力军,在训练大型复杂模型和支持高效的大规模实时推理方面表现卓越。GPU 能够利用其并行处理能力,加速大型和中型模型的训练。同时,GPU 为大规模部署的实时推理提供所需的速度和可扩展性。但要充分发挥GPU的潜力,与合适的 CPU结合可显著提高 AI 效率。

而这样的CPU需要具备高频率,快速高效地处理大量数据准备和后处理任务;大容量高速缓存,便于快速访问海量数据集;高内存带宽和高性能 I/O,支持 CPU 和 GPU 之间快速无缝地交换数据;高能效核心,节约功耗以供 GPU 使用,同时有助于降低整体能耗;兼容 GPU 和软件生态系统,实现性能优化、效率提升和流畅运行。

AMD EPYC(霄龙)9005 系列处理器专为加速数据中心、云计算和 AI 工作负载而设计,助力企业将计算性能提升到全新水平。该处理器基于Zen5/Zen5c架构,采用台积电4nm/3nm工艺制造,IPC提升高达17%,最高规格为192核/384线程,运行频率最高可达5GHz。采用全新“Zen 5c”核心架构可提供更高的吞吐量和更高的能源效率,与竞品相比,插槽吞吐量预计可提升高达1.3倍,每瓦效能预计可提高1.3倍。每个插槽高达6TB的DDR5存储器容量、扩展的I/O连接性以及透过CXL2.0支援高达160条PCIeGen5通道,还支持更多安全功能。



据介绍,使用 AMD EPYC(霄龙)9005 处理器,在机架数量减少多达 86% 的情况下仍能实现与原有硬件相当的整数性能,大幅减少了物理占用空间、功耗和所需软件许可证数量,从而为运行全新或扩展的 AI 工作负载腾出空间。

基于 AMD EPYC(霄龙)9005 CPU 的纯CPU型服务器能够高效处理大量 AI 工作负载,如具有 130 亿个及以下参数的语言模型、图像和欺诈分析或推荐系统。与上一代产品相比,运行两个第五代 AMD EPYC(霄龙)9965 CPU 的服务器可实现高达2倍的推理吞吐量提升。

作为CPU AI 平台,基于 AMD EPYC(霄龙)处理器的服务器可高效运行推理工作负载,满足各类模型和应用场景的需求。AMD EPYC(霄龙)CPU 具有出色的灵活性,可充分满足从实时推理到批量推理或离线推理等的一系列需求。

以 FP32 精度运行常用的梯度提升模型 XGBoost(Higgs 数据集)时,基于 192 核 AMD EPYC(霄龙)9965 处理器的双路服务器的推理吞吐量(平均每小时运行次数)是原有解决方案的 3 倍之多。

AMD EPYC(霄龙)9005 系列中的有些型号经过专门优化,在搭载 GPU 的系统中用作主机 CPU时可帮助提高特定 AI 工作负载的性能,从而提高每台 GPU 服务器的投资回报率。例如,运行 Llama3.1-70B 时,在相同情况下使用高频 AMD EPYC(霄龙)9575F 处理器且搭载 8 个 GPU 的服务器在系统性能上可提升高达 20%。
五大CPU推理负载

AI 推理是指将经过训练的 AI 模型应用于全新数据并据此做出预测。AMD 具有一系列专为 AI 推理打造的出色解决方案,可适应不同模型大小并胜任不同的应用需求。对于需要尽量接近数据源的中小型 AI 模型和工作负载而言,AMD EPYC(霄龙)处理器是适合之选。对于延迟不会造成重大影响的批处理或离线处理应用而言,AMD EPYC(霄龙)处理器是可以满足推理需求的高性价比解决方案。

具体来看,一个现代的数据中心必须支持多种AI工作负载,而这些工作负载中很少有是完全相同的。通过精心配置,数据中心可以在成本较低的CPU上支持许多AI服务,并将预留的GPU用于更繁重的工作负载。

传统的机器学习算法无法从并行计算GPU中受益,使用决策树、随机森林和线性统计模型的机器学习任务能从多核心CPU中受益而通常并不充分利用并行计算GPU所提供的优势。如果情感分析、文本和图像分类、欺诈检测或时间序列预测等工作负载在您的负载中占很大比例,那么配备最高可用核心数的CPU将是一个明智的投资选择。

模式识别和深度学习视觉模型在CPU上表现良好。面部识别、物体检测、图像分类、热图分析,乃至缺陷和异常检测,都可以在GPU上以极快的速度运行,但可能并不一定需要达到那样的响应速度。在企业级和边缘用例的规模化场景下,CPU通常也能相当高效地处理视觉任务。

在内存密集型图分析方面,对于大型数据集的图分析,CPU通常优于GPU。复杂网络如社交网络、IT系统、物流和供应链等拥有复杂的节点、交互和模式,最适宜用图算法进行分析。它们还能生成庞大的数据集。CPU拥有直接且低延迟的访问系统RAM的能力,这使得它们能够在内存中处理大型数据集,从而省却了与存储设备的读写循环。选择拥有最高可用内存速度和容量的CPU以获得最佳性能。

小型到中型推荐系统上,CPU非常适合实时推荐引擎。频率更高、核心数量更多的CPU为推荐系统提供了足够的并行化和处理速度。对于实时的推荐系统,应选择具备大缓存、支持高速RAM且能充分利用系统内存的CPU。

此外,CPU为特定任务微调模型可以显著减少其占用空间。诸如参数高效微调(PEFT)和低秩适应(LORA)等技术能够将大型通用模型转化为更小、更高效的模型,从而提供高度准确的结果。在特定知识库(如产品目录、技术文档或托管文件)上经过微调的模型,能够支持在CPU上高效运行的专家代理、聊天服务和决策应用。

更省能耗和空间的方案

单颗AMD EPYC基于9005 CPU的服务器可以完成超过7台2019年款的英特尔Xeon®Platinum服务器的工作量,这有助于降低能源消耗并缩小数据中心占地面积,腾出空间用于新的服务器基础设施,以满足日益增长的AI工作负载需求。

将1,000台基于IntelXeon Platinum 8280 CPU的服务器替换为127台基于EPYC 9965 CPU的服务器,以提供391,000单位的整数性能,这将使电力消耗减少多达69%,在五年期间节省多达340万美元的能源账单。

AMD已将硬件创新聚焦于AI领域,提供了诸如AMDInstinct这样的优化解决方案。加速器与EPYCCPU相结合,可帮助您最大限度地发挥在AI领域的投资效益。例如,一个由1,000个节点组成的AI集群,使用了8xAMD Instinct MI300X加速器与EPYC 9575FCPU,在运行Llama 3.1-70B(128/2048 I/O tokens,FP8)时,相比使用Intel Xeon Platinum 8592+ CPU的同规模集群,每秒可处理最多70万个tokens。

通过测试AMDEPYC9575Fvs.IntelXeon8592+在AMDInstinctMI300x和基于NVIDIA H100 GPU的系统,可以看到AMD EPYCCPU 降低了推理延迟,提高GPU的利用效率。

在Llama 3.1和Mixtral等AI模型上,基于AMD Instinct™ MI300 GPU的系统平均推理时间快了9%。在Llama3.1和Mixtral等AI模型上,8个Nvidia H100 GPU系统平均推理时间快了8%。




小结:

AMD2025年一季度营收达74.38亿美元,同比增长36%,净利润为15.66亿美元,同比增幅达55%。其中数据中心业务表现尤为突出,一季度营收37亿美元,同比增长57%,超出预期的36亿美元。AMD预计二季度营收在71亿至77亿美元之间,中值为74亿美元,略高于分析师预期的72.4亿美元。

得益于人工智能产业的爆发式增长,以及AMD产品竞争力的提升,后续有望在数据中心处理器市场持续扩大份额。




希望以上内容对您有帮助。

阅读全文
相关推荐
百科视频推荐精选问答
养生文章推荐
斯内德兄弟情深 荷兰支持小弟首秀

“体育精神”走进“百城千乡万村·社区”——普格足球赛今日开赛!

斯内德兄弟情深 荷兰支持小弟首秀
根据SS24发回的现场报道,斯内德在对切沃的热身赛前一天的首场训练中脚踝受到撞击。为谨慎起见,蓝黑核心退出了第二场训练,也没有参加随后的比赛。那么斯内德在哪里度过这段多出来的时间呢?答案是荷兰。他和妻
RTX5050现身跑分 比前代快11%:核心数量一点没多

红苹果家具30周年庆派 红苹果震撼愚人节-

RTX5050现身跑分 比前代快11%:核心数量一点没多
6月17日消息,NVIDIA即将推出的GeForce RTX 5050移动版显卡终于在Geekbench上露出了真容,其性能和部分规格也得以确认。从Geekbench的测试结果来看,RTX 5050移
今起,铁路部门优化车票改签规则

跨界是否能让电动车企业缓解竞争压力?

今起,铁路部门优化车票改签规则
自1月15日起,铁路部门优化车票改签规则,扩大车票改签范围,旅客在开车前和开车后当日均可改签预售期内车票,将进一步便利旅客购票出行。根据《民法典》《铁路法》《铁路旅客运输规程》《铁路客运运价规则》等规
天下晨間新聞  臉書改名Meta!  聚焦元宇宙|天下雜誌

陕西省家具协会理事长会议暨陕西家具产业升级论坛昨举行-

天下晨間新聞  臉書改名Meta!  聚焦元宇宙|天下雜誌
臉書改名Meta!要用元宇宙接觸10億人。蘋果公布財報,盤後股價崩,發生什麼事?您的閱讀篇數已達上限立刻訂閱全閱讀,即可享全站不限篇數閱讀
甲烷中二氧化碳混合气体标准物质:助力二氧化碳混合气体检测

厦门对医疗机构价格公示 3月1日起这么做

甲烷中二氧化碳混合气体标准物质:助力二氧化碳混合气体检测
在能源勘探、环境监测以及工业生产等多个关键领域,二氧化碳混合气体的准确检测显得尤为重要。而甲烷中二氧化碳混合气体标准物质,作为检测过程中的“黄金标尺”,为这一领域提供了不可或缺
今起,铁路部门优化车票改签规则

视频一次看个够!元宵节德昌草坝场好热闹

今起,铁路部门优化车票改签规则
自1月15日起,铁路部门优化车票改签规则,扩大车票改签范围,旅客在开车前和开车后当日均可改签预售期内车票,将进一步便利旅客购票出行。根据《民法典》《铁路法》《铁路旅客运输规程》《铁路客运运价规则》等规
泉州:89岁阿婆高速上受伤 警方开辟绿色通道救援

30天30队公牛:弃罗斯改造阵容 韦德朗多添变数

泉州:89岁阿婆高速上受伤 警方开辟绿色通道救援
闽南网9月2日讯闽南网记者 陈玉玲 通讯员 刘闽华)今天上午,泉南高速发生一起追尾事故,导致2人受伤,其中有一位是89岁高龄的阿婆。事故发生后,泉州高速交警第一时间开辟救援绿色通道,在8分钟的时间内将
安徽消保委发布生鲜电商评测结果 部分商品名不副实

常见主流的污水处理工艺有哪几种(污水处理工艺分类讲解)

安徽消保委发布生鲜电商评测结果 部分商品名不副实
中国消费者报报道(记者 司宇萌)哪家购物App好用?哪家生鲜蔬菜种类丰富且价廉物美?日前,安徽省消保委公布了生鲜电商消费评测结果。其中,价格比较测评发现,同一时间段、同种商品、同等数量的商品,在不同电
国网定西市安定区供电公司:强化监督问效 规矩服务行为

订购红砖无法交付 经消委会调解厂家退款28万元

国网定西市安定区供电公司:强化监督问效 规矩服务行为
8月24日,国网定西市安定区供电公司组织营销、办公室人员对辖区内各综合业务大厅开展四不两直现场督察,对现场业务办理情况进行督导检查,进一步规范服务行为,提升服务质效。综合业务大厅作为供电服务的末端单元
微软AI Agent再升级

天下晨間新聞 美股崩跌1100點,衰退將至?

微软AI Agent再升级
AI智能体正重塑人机协作模式,不仅能响应指令,更能主动预判需求、执行复杂任务并持续进化:在办公领域,它已经能辅助完成高效的数据分析与洞察;在安全领域,它们可自动应对钓鱼攻击与数据风险;在开发领域,智能