正文

AMD 在 AI 推理领域悄然领先

(2025-09-24 02:14:18) 下一个

AMD (NASDAQ:AMD) 在过去数年中从落后者成长为有力竞争者,这得益于其在数据中心 CPU 领域的某些优势以及向 AI 加速器迁移的加速。上个季度该公司表现强劲,但过于关注短期波动的投资者却忽略了整体情况。

AMD 构建了涵盖 CPU、GPU、AI PC 以及未来机架式系统的多引擎增长基础设施。后者将推动 CPU 的长期增长周期,并将在未来十年内规划其未来发展。

分析师仍然看好AMD。最近的回调与其说是疲软,不如说是健康的调整,并重新定位至新的高点,此前其已从最初看涨的97美元上涨了62% 。

AMD 未来最关键的战场就在数据中心 因为现在推理任务的算力需求已经超过了训练,成了算力需求的第一驱动力。不管是超大规模科技公司、各国政府,还是普通企业,都在想办法降低成本,同时支撑更大规模的模型落地。
这说到底,其实是改变了 AMD 的竞争逻辑:以前比的是训练速度,现在 每单位 token 的成本 才是核心指标。

AMD2025 年第二季度数据中心收入达到 32.4 亿美元,同比增长 14%,这得益于创纪录的 EPYC CPU 销量。Turin 的采用率正在极快增长,EPYC 目前已支持超过 1,200 个云实例,这使得 AMD 成为 x86 服务器领域除英特尔之外的可靠第二供应商。这些处理器不仅占据了市场份额,还充当着关键的编排引擎,用于需要高内存带宽和优化任务调度的推理工作负载。

不过 AI 加速器(GPU)这边,情况就有点好坏参半了。AI GPU 营收同比下滑,主要是因为从 MI300 过渡到 MI350,再加上出口管制的影响 AMD 还为此对 MI308 做了 8 亿美元的库存减值。但管理层拍胸脯保证,MI355 会 改写规则。从测试数据来看,MI355 每花 1 美元能处理的 token 数量,比英伟达 B200 多 40% 这可是超大规模公司最看重的 性价比指标,毕竟现在推理业务正往大规模落地阶段走。

该计划也提供了一致性。MI350 的量产于今年 6 月启动,预计在 2025 年下半年实现量产。稍远一点的 2026 年,MI400 Helios 平台的目标是实现高达 40 petaflops 的 FP4 吞吐量,并将内存带宽提升至少 50%。AMD 将 Helios 扩展到机架级别,直接面向超大规模计算用户,强调他们目前购买容量的方式:购买整机架的优化计算资源,而不是处理器。最大的问题仍然是软件。

英伟达的 CUDA 护城河依然存在。然而,AMD 的 ROCm 7 正在弥合这一差距,与上一代产品相比,其训练和推理吞吐量提升了 3 倍以上,并为 vLLM、SGLang 以及 Llama 4 和 DeepSeek R1 等旗舰模型提供即时支持。凭借全新的 ROCm 企业 AI 堆栈,AMD 终于拥有了企业级质量的软件堆栈。如果这一趋势持续下去,它将巩固其应用的一个重要瓶颈,并使 AMD 在推理经济性方面目前处于领先地位的重要指标上占据竞争优势。

总体而言,数据中心业务(占 AMD 第二季度合并营收的 42%)已不再是 CPU,而是 CPU 和 GPU 的组合、推理经济性和机架级架构。AMD 的估值溢价将决定这一领域的胜败。顺便提一句,人工智能推理市场将在2025 年至 2030 年期间以 17.5% 的复合年增长率增长,从 2025 年的 1135 亿美元增至 2030 年的 2530 亿美元以上。由于推理工作负载的增长速度快于训练,AMD 具有成本优势的加速器和 EPYC CPU 可以在这一快速增长的机遇中占据相当大的份额。

如果说推理是短期增长的刺激因素,那么自主AI和机架级系统则是AMD的长期差异化优势。收购ZT Systems(于2025年3月完成)并非增加了收入,而是增加了能力。ZT的工程人才和IP使AMD能够在机架级进行设计,与英伟达的DGX和GB200机架进行一对一的竞争。AMD将于2025年底将ZT的制造部门剥离给Sanmina,并保留其中最重要的部分设计和集成专业知识。

此举也与AMD 的 Helios 路线图相符。MI350 系列主要以芯片形式销售,而 Helios 则被概念化为机架级系统,每个机架配备 72 个 GPU。这些预配置系统反映了当今超大规模数据中心的购买习惯。甲骨文 (ORCL) 确实利用 MI355 加速器、EPYC 处理器和 Pollara SmartNIC 构建了一个27,000 个节点的集群,这一事实验证了这一战略可能性。这表明 AMD 不仅可以作为芯片提供商参与竞争,还可以作为系统提供商参与数万节点规模的配置竞争。

同样重要的是,AMD 在 自主 AI 领域的发力。现在它在美国、欧洲还有新兴市场,已经有 40 多个正在推进的政府项目。这些项目的核心需求是 自主可控 要在本国自己的基础设施上跑 AI 任务,受本国管控。AMD 的优势就很明显了:推理性价比高、ROCm 是开源生态,还愿意搞 自主合作,这对英伟达来说是个有力的替代选项(毕竟英伟达的 CUDA 本质上是 绑定式生态)。

从财务角度看,自主 AI 协议还有个好处:能让营收不再依赖超大规模公司的周期波动。超大规模公司的需求季度性很强,比如二季度就因为 GPU 销量下滑受了影响;而自主 AI 项目都是 多年期合作,资金稳定,能给 AMD 的长期增长当 压舱石。

随着整机柜和自主 AI 业务的推进,AMD 在生态里的角色可能会被重新定义 它不只是提供 CPU 和 GPU,还会成为 AI 时代基础设施的联合设计者。现在 AMD 的估值还没反映出这种转型,但理论上,等它从 大规模系统玩家 升级成 能在元器件层面竞争的玩家,估值体系也会跟着重构。

AMD 2025财年40.4倍和2026财年26.2倍的预期市盈率与行业中位数25倍一致。起初,由于企业价值/息税折旧摊销前利润(EV/EBITDA)倍数是行业倍数的两倍,这一倍数可能表明估值过高。然而,这一倍数需要结合AMD的盈利增长及其在人工智能基础设施领域的未来发展来看待。随着推理工作负载的激增和MI350/MI355的提升,市场普遍预期每股收益将从2025年的3.90美元增长到2026年的6.01美元,增幅预计达55%。

与此同时,营收将从2025年的330亿美元增至2026年的401亿美元。如果AMD的预期市盈率增长比(PEG)为0.94倍(GAAP)和非1.31倍(Non-GAAP),这将使其增长调整后的估值比投资者基于新闻报道的估值倍数所认为的更为合理。也就是说,投资者不仅看重今天的业绩,还看重AMD在广泛的AI推理和机架级系统市场中的份额,在这个市场中,单位成本性能而非纯粹的计算能力才是推动其持续普及的关键。

AMD 的增长曲线仍有很长的路要走。现在的高估值,是建立在 GPU 顺利量产 + 推理业务爆发 的理想假设上,容错空间很小。而且客户太依赖超大规模公司,也会增加波动 比如这些公司的采购周期变了,或者自己搞芯片了,需求可能一下子就变了。另外,监管风险也是个长期隐患,比如 2025 年二季度就因为出口管制,导致了 8 亿美元的减值。

还有个争议点是竞争:英伟达靠 CUDA 生态还占着主导地位,超大规模公司自己做定制芯片、英特尔也在发力,这些都是竞争对手。最后,AMD 现在的 资本密集度 也很高 为了在 GPU 研发和系统集成上追赶,牺牲了部分 CPU 的市场份额,这就要求它必须严控成本,避免利润率下滑。要是 GPU 量产不及预期,或者软件 adoption 跟不上,现在结合增长算出来的估值,可能就显得太高了。

对投资者来说,AMD 是个 稳中有升 的选择:EPYC CPU 能提供稳定、高毛利的营收,而 GPU 和整机柜系统,则能在推理和自主 AI 需求里实现 超额增长。最近这波回调是健康的调整,不是趋势反转。只要 AMD 能按计划推进 GPU 路线图,完善软件生态,股价肯定能突破新高,给长期持股的股东带来复利收益。

[ 打印 ]
评论
目前还没有任何评论
登录后才可评论.