SK海力士蓄势盘整, 三星补涨。 最近MU和SK海力士联动,明MU大概率跟随 SK海力士蓄势盘整,
HBM 工作的物理基础,以及减轻存储公司产能过剩风险的逻辑,主要源于物理结构的极端复杂性、产能消耗的放大效应以及商业模式的根本转变。
HBM 之所以减轻存储公司产能过剩风险,是因为它极其费料。
芯片面积巨大: 同样容量的 HBM 芯片,其晶圆面积(Die Size)通常是传统 DDR5 的 两倍以上。这意味着存储工厂(Fab)即便满负荷运转,产出的 HBM 颗粒数也远少于传统内存。
良率损失: HBM 是由 8 层、12 层甚至 16 层 DRAM 垂直堆叠而成的。如果其中一层坏了,整颗 HBM 芯片就报废了。这种极低的综合良率(Yield)进一步消耗了大量晶圆产能。
以前存储公司容易产能过剩,是因为大家都在拼命生产标准化的 DDR。现在,大量的设备和产能被调去生产 HBM,导致标准 DDR 的供应反而收缩了,从而维持了整个存储市场的价格稳定向上。即使新增加DRAM产能, 在算力指数需求的增加下, 也是远远不能满足需求的。
HBM3E, 4 的生产良率业界普遍低于 60%,这意味着即使拼命扩产,实际可出货量也受限。
┌─────────────────────────────┐
│ HBM栈 │ GPU/ASIC │ 同一硅中介层上
│ (垂直叠4-8层)│ (A100/H100) │
└─────────────────────────────┘
硅中介层 (Silicon Interposer)
按需定产,不再盲目: 传统的内存是先生产出来,再卖给金士顿或电脑厂家。而 HBM 是订单制。美光(MU)或 SK 海力士会根据英伟达 B200 , AMD GPU或谷歌 TPU 的出货量计划来排产。
物理集成不可拆分: 一旦 HBM 被封装在 GPU 衬底上,它就不再是独立零件。这种强绑定意味着存储公司变成了 AI 芯片供应链的直接合伙人,而不是下游供应商。
零库存风险: 只要英伟达, AMD 和谷歌的 AI 芯片卖得掉,存储公司的 HBM 就没有库存压力。
HBM 减轻产能过剩风险的本质,是它把通用商品的供需逻辑,变成了为GPU, ASIC定制供需逻辑每一颗 GPU或ASIC 出厂都必须带着固定数量的 HBM,没有 HBM 就没有 GPU,需求端由科技巨头的 AI 资本开支驱动,而非消费者的喜怒无常。
这是减轻过剩风险的心理防线:
定制化属性: 不同代的 TPU 或 GPU 对 HBM 的层数、速度、电压要求不同。存储公司现在需要与芯片设计方(NVDA/GOOG/AMD)提前 18-24 个月进行联合研发。
长期合同(LTA): 为了锁定 HBM 供应,像 OpenAI 或是微软这种大买家,会通过芯片厂给存储厂商下长达数年的预付款订单。
这意味着: 存储厂商在扩建工厂前,手里已经拿到了客户的订金和保底合同。这与以前先盖厂、再看市场行情的博弈模式有本质区别。
过去: 存储 = 周期性大宗商品(像猪肉、石油,容易过剩)。
现在: 存储 = AI 系统的核心组件(像发动机,必须配套)。
这种转变意味着: 只要 AI 算力竞赛不停止,存储巨头们就处于被动去产能的状态因为 HBM 实在太难做、太占资源了,他们根本没有多余的力气去制造过剩的普通内存。
风险转化为:
AI Capex 若突然收缩(如经济衰退),GPU 出货下滑会直接传导到 HBM 需求
HBM技术跃迁:新一代切换期间存在短暂的库存调整窗口