半导体行业过去有过无数次繁荣。资深分析师们早已学会对"超级周期"(supercycle)这个词打折扣——它在每一个顶部都会出现,又在每一个底部分崩离析。但这一次,覆盖芯片行业二十年的 Stacy Rasgon 认为,这个词真的成立了。
本文整理自 Celesta Capital 创始合伙人、传奇硬件人 Michael Marks 与伯恩斯坦(Bernstein)知名半导体分析师 Stacy Rasgon 的一场深度对谈。两人系统拆解了:AI 浪潮下的半导体营收激增、训练向推理的迁移、贯穿全产业链的产能瓶颈,以及行业未来十年的可持续性与风险。
"我整个职业生涯都在听'超级周期'这个词。也许,这是我第一次真正见到它。" — Stacy Rasgon, Bernstein Research
PART 01供给周期不等于需求周期
Rasgon 首先把两种常被混为一谈的模式区分开来。
供给周期是经典的存储模式:价格收紧 → 供应商扩产 → 客户因拿不到货而重复下单(double-order) → 新产能开出的同时重复订单反转 → 供给超过需求 → 市场跳水若干个季度。过去每一次所谓"超级周期",都不过是这一模式在更大规模上的重演。
真正的超级周期则由真实、持续的需求把行业向前拉动。AI 基建恰好制造了这种模式——这一点直接反映在云厂商的资本开支上。2026 年规划支出中约 75% 被指定用于 AI 基础设施,而非传统云业务。剩下的瓶颈不再是定价权,而是物理产能:洁净室的建设速度有硬性上限,供给方想跟上却跟不上。
PART 02摩尔定律的终结,让行业四十年来第一次"理性"
Rasgon 引用了 Broadcom 联合创始人兼 CTO Henry Samueli 在 2012 年的一场分析师演讲。Samueli 把摩尔定律的瓦解,称为这个行业经济史上最重要的结构性事件。
过去四十年,客户是免费获得性能提升的:每两年,同样面积的硅片上集成两倍的晶体管,而成本基本不变。Samueli 的论点是——当摩尔定律走到尽头(大约在 28 纳米节点,每晶体管成本停止下降),行业将不得不开始为"性能"向客户收费。他称之为"行业四十年来第一次变得理性的时刻"。
"摩尔定律终结之后,这个行业即将四十年来第一次变得理性。" — 转述 Henry Samueli, 2012
结果显而易见:在单位出货量基本持平的情况下,全行业的平均售价(ASP)在 2024 年比 2019 年高出约 50%;英伟达数据中心毛利率稳定在 75% 附近;DRAM 已收敛为三家供应商——三星、SK 海力士、美光,合计掌控超过 80% 的市场。当 AI 需求撞进这样的市场结构,结果就是寡头定价。
PART 03存储超级周期与"转换比率"之谜
存储正处于历史上最强劲的超级周期之一,价格每个季度都在飙升。背后的核心驱动是 AI,尤其是 HBM(高带宽存储)。Rasgon 透露了一个关键的结构性细节:
- 在一颗 AI 芯片的"光罩预算"(wafer area)中,85% 以上的面积可能都被 HBM 占用。
- 更关键的是"转换比率"(trade ratio):受堆叠和封装的几何约束,生产 1GB 的 HBM 所需的晶圆面积,大约是标准 DRAM 的 4 倍。
- 这意味着:即使晶圆产能不变,实际可供应的存储比特数也相当受限——存储侧的有效产能天然吃紧。
因此,存储的紧缺并不只是"涨价周期",而是一种由 AI 几何结构决定的、难以靠简单扩产解决的硬约束。只要 AI 需求不崩,这一供应逻辑就不会改变。
PART 04钱在推理(inference),不在训练
"你无法靠训练模型赚到任何钱。英伟达靠卖芯片赚钱,但用模型去推理——这才是真正赚钱的地方。" — Stacy Rasgon
Rasgon 直指要害:当前大模型训练的繁荣并非产业经济的终局。训练一个基础模型,是一个庞大而不规则的任务;而运行这个模型,是数百万个小而重复、形态可预测的任务——可预测的工作负载,正是定制 ASIC 的用武之地。
这种转型已经反映在头部 AI 公司的经济曲线上。以 Anthropic 为例,其年化收入呈现出近乎垂直的爬升态势:
英伟达收购 Groq,则给这场"推理转移"标上了价格。一家通用 GPU 厂商,付费买下一家只做一件事的公司——以亚秒级延迟运行推理。原因在于:AI 经济中最有价值的 token,来自那些"答案必须在一秒内到达"的推理负载。这类对延迟敏感的 token,售价是驱动平均定价的批量 token 的数倍。谁拥有服务它们的架构,谁就攫取了整个建设中最集中的收入层。
"普通、批量的 token 没什么利润;但那些需要低延迟、要快速响应的 token,价格是普通 token 的数倍。谁能提供低延迟推理服务,谁就能获得最好的经济回报。"——这正是 Groq 聚焦的场景,也是英伟达愿意为之付费的原因。
PART 05ASIC 与 GPU 的真正分野
在需求爆发的背景下,定制芯片(ASIC)正在英伟达的 GPU 帝国边缘攻城略地。博通(Broadcom)成为这一趋势最大的受益者之一。
Rasgon 提及博通时表示:在这一切开始之前,市场视半导体为一个低增长行业,只给中等估值;如今这一切都炸开了——博通管理层甚至说,它的 AI 业务收入目标将达到 1000 亿美元。
但 Rasgon 强调,这并非"谁取代谁"的零和游戏。真正的关键不是 GPU 和 ASIC 谁赢谁输,而是:前面的护城河(市场空间)是否足够大,足以让两者都持续增长。
| 维度 | GPU(通用可编程) | ASIC(专用定制) |
|---|---|---|
| 适用场景 | 研究、探索性推理、训练 | 大规模、稳定、可预测的负载 |
| 核心优势 | 灵活性、可编程 | 更低的总拥有成本(TCO) |
| 风险 | — | 模型架构若变,需重做芯片 |
| 代表 | NVIDIA | Google TPU、Amazon Trainium |
| 市场份额 | 主体 | 约十几% → 或升至 25–30% |
值得注意的是超大规模云厂的垂直整合:谷歌的 TPU 已经迭代了 14 年,目前在第八、第九代之间;亚马逊有训练芯片 Trainium、推理芯片 Inferentia,以及自研 CPU Graviton。这些已经自己设计芯片、最清楚自己要算什么的云厂,正把越来越多的价值捕获拉进自家高墙之内。
PART 06设备与代工:最长的前瞻视野
被 AI 浪潮重新定价的名字,遍布整条半导体价值链——往往是因为今天根本不存在替代品。设备制造商的多年期订单积压,唯一受限于物理产能;存储供应商只要没有经济替代品就能保有定价权;绑定云厂工作负载的 ASIC 设计商有多年的收入可见度;而它们之下的代工厂,拥有所有人中最长的前瞻视野。
- Lam Research 的刻蚀设备价格已翻数倍,因为先进封装与存储扩产都离不开它。
- Applied Materials 数年翻了约 5 倍,ASML 亦大致同步。
- 设备行业本质上是一个"反约束"强的赛道:设备卖不出去往往不是没有需求,而是先要建好晶圆厂、装好洁净室,才能接收设备——而洁净室的建设速度是有硬性上限的。
PART 07最终瓶颈:电力
当被问到这一切最容易忽视的风险时,Rasgon 把目光从芯片本身,移向了支撑它的基础设施——电力。
"我们的电网没有足够的电力增长,来支撑这场建设。电力供给大约每年只增长约 0.5%,而 AI 所需要的是未来十年每年约 5%——以电力设备分析师的话说,这几乎是无法实现的。" — Stacy Rasgon
这意味着,下一个真正的瓶颈,可能不是芯片或洁净室,而是电力本身。算力可以靠资本堆出来,电力却滞后于资本数年——而且电力的瓶颈一旦出现,本地化的发电与地方电网将面临巨大压力。
PART 08底线与风险
这个行业的大多数周期,都因一个可预测的原因破裂:产能跑到需求前面,客户群只买当下用得到的,供应商和代工厂被迫背上无法消化的产出。
但这一轮的形态不同。AI 需求是提前数年、针对云厂已宣布并已承诺的工作负载锁定的;存储十多年前就整合为三家寡头,移除了击垮历次存储周期的"繁荣—萧条"机制;摩尔定律的终结,又拿走了让买家每两年用更少的钱买到更多算力的历史性价格缓冲。这四个条件中任何一个单独出现都不足以改变分析,但四者同时对齐,就是新的结构性转变。
设备制造商:多年期订单积压,仅受物理产能限制。
存储供应商:只要没有经济替代品,就保有定价权。
ASIC 设计商:绑定云厂负载,客户继续建设就有多年收入可见度。
代工厂:拥有所有人中最长的前瞻视野。
但风险也很明确:这一领域龙头的根本风险在于,公开数据比真实经营画面滞后数个季度。等到指标转向时,周期可能已经开始了潜在的下行。Rasgon 的判断是——只要 AI 需求不发生悬崖式崩塌,半导体产业链的"超级周期"就会延续;而资本市场,必须跟上每一个环节里不断移动的"产能瓶颈"。
一句话总结:这一次的不同,不在于增速有多快,而在于推动它的需求是真实的、锁定的,而供给侧的每一个环节都被物理与寡头结构卡死——从晶圆设备、先进封装、HBM 存储,到代工与电力。