AI 数据中心的「主芯片」环节——通用 GPU(NVIDIA / AMD)与定制 ASIC(Broadcom / Marvell 给 Google·Amazon·Microsoft·Meta 代工)的同台竞逐。它是 Hyperscaler CapEx 砸下来的第一落点,向下游拉动 HBM、CoWoS、光模块、PCB 四大配件。本篇把这条传导链量化讲透,并给出空头不软化的估值判断。
是什么:AI 算力的「主芯片」,分通用 GPU(一卡通吃)和定制 ASIC(hyperscaler 自研、专用)两条路线。多大:加速器芯片 TAM 2024 约 $160B(GPU $130B + ASIC $18B),2033 看 $604B(Bloomberg Intelligence,2026-01)。谁赢:NVIDIA 仍是绝对龙头(AI 加速器份额 ~80%+),但份额从 ~90% 边际下滑,定制 ASIC 是结构性第二增长极。我的观点:需求与传导链是真的、估值倍数不极端,但 2027 是「四线收敛」的考验年——这不是估值泡沫,是盈利可持续性的赌局。
注:风险维度的柱长代表「风险大小」(越长越差),已在加权时反向计入。权重为本报告主观设定,供横向比较其他 primer 用。
本篇口径 = 数据中心 AI 训练/推理加速器主芯片:通用 GPU(NVIDIA、AMD)+ 云厂定制 ASIC/XPU(Google TPU、AWS Trainium、Microsoft Maia、Meta MTIA,由 Broadcom/Marvell 协同设计)+ 国产 AI 芯片(昇腾、寒武纪、海光、摩尔线程等)。
明确不含(OUT):① 消费级游戏显卡;② CPU(除非作为加速器配套,如 NVIDIA Grace、华为鲲鹏);③ 边缘/端侧 NPU(手机、汽车);④ AI 推理初创的小众架构(Groq/Cerebras/SambaNova 只在分歧章节作为「推理芯片」论据出现,不计入主 TAM);⑤ 上游配件本身(HBM/CoWoS/光模块/PCB——各有独立 primer,本篇只讲 GPU 对它们的传导)。这条边界是防 TAM 注水的第一道闸门:把「AI 数据中心整体市场(含土建电力)$344B」当成「加速器芯片市场」是最常见的口径错误。
GPU/加速器是 Hyperscaler CapEx 砸下来的第一落点:每一美元数据中心资本开支,约一半最终落到「加速器 + 其紧贴的 HBM/封装」上。理解这个赛道的关键,是看清 GPU 出货如何逐级传导到下游四大配件——这也是它和你已做的四篇报告的接口。
GTC 2025(2025-03)NVIDIA 把路线图画到 2028,确立年度 tick-tock:Blackwell(2024)→ Blackwell Ultra(2025)→ Rubin(2026)→ Rubin Ultra(2027)→ Feynman(2028)。每代对 HBM/CoWoS 的「单卡消耗」都在抬升,这是配件环节量价齐升的根。(NextPlatform 2025-03-19;Tom's Hardware 2025-03)
| 代际 | 型号 | 量产 | 制程 | HBM 配置 | 封装 | 单卡功耗 | 机柜形态 | 相对上代 |
|---|---|---|---|---|---|---|---|---|
| Hopper | H100 / H200 | 2022H2 / 2024H1 | TSMC 4N | 80GB HBM3 / 141GB HBM3e | CoWoS-S | 700W | HGX 8-GPU | 基准 |
| Blackwell | B200 (GB200 NVL72) | 2024H2 起 | TSMC 4NP | 180–192GB HBM3e(8 stack) | CoWoS-L 3.3× | ~1,000W | GB200 NVL72 | FP4 推理 ~5× H100 |
| Blackwell Ultra | B300 (GB300 NVL72) | 2025H2 量产 | TSMC 4NP | 288GB HBM3e(8 stack) | CoWoS-L | ~1,400W | GB300 NVL72 | 比 GB200 再 +50% |
| Rubin | R100 / VR200 NVL144 | 2026H2(Q1'27 放量) | TSMC N3 | 288GB HBM4(8 stack) | CoWoS-L 4× | ~1.8–2.3kW ⚠️ | VR200 NVL144 | ~5× Blackwell |
| Rubin Ultra | NVL576「Kyber」 | 2027H2 | N3/N2 级 | 1TB HBM4e | CoWoS-L 更大 | 未公布(更高) | NVL576 600kW 机柜 | ~14× GB300 NVL72 |
| Feynman | (2028) | 2028 | A16/1.6nm | 下一代 HBM(未官宣) | — | — | — | 路线图远期 |
⚠️ Rubin 单卡功耗 1.8–2.3kW 各源不一、且为路线图非量产值。所有规格来源:NextPlatform / Tom's Hardware / TrendForce / Wedbush / VideoCardz,2025-03 至 2026-01。HBM stack 数 H100 最多 6 → B 系/Rubin 固定 8;容量 80GB→288GB(3.6×);CoWoS interposer 面积 1×→3.3×→4× reticle,即每代单卡吃掉的封装面积近乎翻倍。
以 B200 单卡 和 GB200 NVL72 单机柜(72 GPU) 为两个锚点,量化 GPU 出货如何变成下游四个环节的收入。下面所有 BOM 数字均为第三方逆向估算(Epoch AI / SemiAnalysis / Morgan Stanley),NVIDIA 不披露 BOM,引用须保留「估算」字样。
Epoch AI / Silicon Analysts / Wedbush,2026
3DInCites / SemiWiki / Digitimes,2025–26
SemiAnalysis / FiberMall,2025–26
Morgan Stanley / SemiAnalysis,2026
① CoWoS 先进封装——最硬瓶颈。多个卖方明确「真正的闸门不是 HBM stack,而是把 die+HBM 封成大芯片的 CoWoS 系统」。台积电 CoWoS 2025 全年至 2026 持续 sold out,NVIDIA 锁 >60%;物理根因是每代 reticle 占用翻倍,扩产追不上单位消耗。
② HBM——同样售罄,但有三供应商缓冲。全行业 2026 已售罄(SK海力士/三星/美光),但相对 CoWoS 多了供应商冗余;风险在 HBM4 切换期份额高度集中于 SK海力士(60–70%)。
③ GPU die(台积电 N4/N3)——紧但非最硬。先进逻辑产能与 CoWoS 同步扩,是「贵」更甚于「缺」。
④ 机柜级组装(GB200 NVL72 液冷/良率)——2024–25 初期痛点,2026 已大幅缓解,从「瓶颈」降级为「工程化已解决」。
Medium/elongated_musk 2026-04 · FusionWW 2026 · SemiAnalysis · Digitimes 2025-12 · Wedbush CES 2026
So what:瓶颈在封装/内存而非 die,意味着两件事——(1) 谁卡住 CoWoS/HBM,谁就分走 GPU 的超额利润(台积电、SK海力士议价权极强);(2) 一旦 2026–2027 这两个环节产能翻倍扩出来,GPU 可能从「分配制短缺」快速翻转为「价格战过剩」,这是 §08 分歧 5(周期反转)的物理基础。
这个赛道 TAM 口径极其混乱(最低 $12B、最高 >$200B),根源是「加速器芯片 / AI 服务器 / AI 基础设施 / AI 数据中心」四个篮子被混用。本篇主锚 = 加速器芯片口径(2024 ~$160B),其余作并列对照,绝不平均。
| 口径层级 | 含义 | 代表数字 | 来源 |
|---|---|---|---|
| A. 加速器芯片(本篇主锚) | GPU + ASIC 纯硅 | 2024 ~$160B → 2033 $604B | Bloomberg Intelligence / SemiAnalysis 2026-01 |
| B. 数据中心加速器(含系统溢价) | 板卡/系统收入 | 2026 >$200B | Silicon Analysts / TrendForce 2026-05 |
| C. AI 基础设施支出 | 服务器+网络+存储 | 2024 $153B → 2025 $318B | IDC 2026 |
| D. AI 数据中心整体 | 含土建/电力/冷却 | 2025 $147B(Grand View)vs $344B(M&M) | 两家差 2.3×,纯口径不同 |
⚠️ 口径冲突最大陷阱:第三方调研机构(Precedence/IntelMarketResearch)的「2025 $10–15B」与 Bloomberg/SemiAnalysis 的「$160B」差一个数量级,几乎确定是「只统计外采加速卡 vs 含系统」的口径差,不可与 A/B 层混用。
carboncredits 2025 / Silicon Analysts 2026 / alatirok 2026-05。绝对收入锚:NVDA FY26 全年 $215.9B,Q1 FY27 数据中心单季 $75.2B(+92%)。
| 芯片 | 状态 | 量化 |
|---|---|---|
| Google TPU v7 Ironwood | 真上量 | Anthropic 单家部署 >100 万颗;Google 计划 2026 出货 430 万→2027 1000 万→2028 >3500 万颗(Broadcom 协同) |
| AWS Trainium 2/3 | 真上量 | Trainium3 2026 年中放量,MS 估 2026 出货 >150 万颗;Trainium4 已发布(Marvell/Annapurna) |
| Microsoft Maia 200 | 早期放量 | 2026-01 发布,曾延期;TSMC 3nm / 216GB HBM3e |
| Meta MTIA | 部分上量(仅自用) | v2 量产、v3 2026 年中、v4 年末送样;全部内部消费,不外卖 |
| OpenAI(Broadcom) | 设计/早期 | 偏 design phase,目标 2029 部署 10GW;尚未量产 |
投资含义:「ASIC 放量」在二级市场最直接的纯标的是 AVGO / MRVL,而非 hyperscaler 本身——后者的 ASIC 多为内部消费,不直接抢公开市场。Tom's Hardware / Introl / TrendForce 2026
| 公司 | 护城河 | 来源 | 一句话 |
|---|---|---|---|
| NVIDIA | Wide | CUDA + NVLink + 迭代速度 + 全 workload 灵活性 | 15+ 年生态锁定,最深单点壁垒;年度架构节奏 + 据报道收购推理芯片公司 Groq 补推理(2025-12,金额未官宣 ⚠️) |
| Broadcom | Wide | 定制 ASIC 设计 IP + 客户深绑(Google 7 代) | 与 Marvell 合占 ASIC 协同设计 ~95%;卖铲子给铲子厂 |
| AMD | Narrow→Wide | 开放 ROCm(仍弱于 CUDA)+ 性价比 | MI355X 在中小 LLM 推理对 B200 有 TCO 竞争力,但对 GB200 NVL72 前沿场景不具竞争力 |
| Marvell | Narrow | 定制 XPU(AWS/MS)+ 光 DSP | ASIC 第二名,但体量小 Broadcom 一个数量级;GAAP 盈利质量弱 |
| Intel | None→Narrow | (被侵蚀) | Gaudi 软件栈弃守、产品线终结——AI 加速器赛道的出局者 |
5 家放一张表。注意财年口径:NVDA/MRVL 财年领先自然年约 11 个月(FY2027 ≈ 自然年 2026);AVGO 财年 11 月结束;AMD/INTC 用自然年。
| 公司 | 代码 | 市值 | 最新季营收(YoY) | 最新季净利(YoY) | 毛利率 | AI/DC占比 | TTM PE | Fwd PE | 估值热度/Setup | 护城河 |
|---|---|---|---|---|---|---|---|---|---|---|
| NVIDIA | NVDA | $5.08T | $81.6B (+85%) 总营收;DC $75.2B | $58.3B (+211%) | 74.9% | DC 92% | ~32–38 | 21–24 | hot(PEG低) · 4/5 | Wide |
| AMD | AMD | $892B | $10.3B (+38%) | ~$1.4B (+98%) | 53% | DC 56% | 高(存疑) | 58–61 | very hot · 2.5/5 | Narrow→Wide |
| Broadcom | AVGO | $1.81T | $22.2B (+48%) | ~$8B 区间 | 77.1% | AI半导体 68% | 65.6 | 25–33 | hot · 3.5/5 | Wide |
| Marvell | MRVL | $230B | $2.42B (+28%) | $34.5M GAAP / $718M nonGAAP | ~50% | DC 76% | n/m(GAAP) | 58 | very hot · 2.5/5 | Narrow |
| Intel | INTC | ~$595B ⚠️ | $13.6B (+7%) | −$3.73B 亏损 | ~低 | Gaudi 个位数% | n/m | 高(存疑) | 投机性 · 2/5 | None→Narrow |
价格/估值 as-of 2026-06-12 至 06-16,来源 StockTitan / CNBC / stockanalysis / GuruFocus / Broadcom IR。⚠️ Intel ~$595B 市值处历史高位、与亏损背离,疑 Foundry/18A + 美政府入股题材驱动,建议二次核验。Fwd PE 跨源差异(AVGO 25 NTM vs 33 FY 口径)已给区间。
Fwd PE 21–24、PEG 0.47,对一个营收 +85%、净利 +211%、毛利 75% 的公司,是「增收+增利」高质量增长。数据中心增速未放缓、反而加速(FY26 四季 $44B→$47B→$57B→$68B,Q1 FY27 跳 $81.6B)。结论:不构成传统估值泡沫。真风险在 $5T 体量下的绝对增长可持续性 + 客户 CapEx 周期 + ASIC 分流,不在倍数本身。
Q2 FY26 AI 半导体营收 $10.8B(+143%)占总营收 68% → 年化 run-rate ~$43B(远超 $12B)。Q3 指引 AI 半导体 $16B;FY26 全年指引 $56B;管理层重申 FY27 >$100B,backlog $73B。客户已确认:Google/Meta/字节/OpenAI/Anthropic;Apple/xAI 仍属传闻(已按潜在处理,不抄媒体夸大)。
口径说明:取通用 GPU/ASIC 纯标的——美国 NVDA/AMD/AVGO/MRVL(🌐),中国 寒武纪/海光/摩尔线程(🇨🇳)。Intel 已剔除(AI 加速器仅个位数占比 + 亏损,是赛道落后者,留在图里会误导)。AVGO/MRVL 为 ASIC 设计模式(非自卖 GPU),保留但标注。中国市值/营收由人民币 ÷7.1 折算。
① 市值(美元 bn,对数感知——NVDA 已是其余总和数倍)
② 营收(最新年/年化,美元 bn)
注:中国营收数字括号内为人民币原值(亿元)。海光营收含 CPU(非纯 AI 芯片)。
③ 净利润(最新年,美元 bn)
④ 毛利率(%)
⑤ Forward PE(越低越便宜,🇨🇳 普遍贵到离谱)
2025 是「国产 GPU 集体冲线」的资本元年:寒武纪扭亏、摩尔线程/沐曦科创板上市、壁仞/天数港股上市。华为昇腾是真正的体量王者(占国产出货近一半),但未上市——A 股能买到的「华为概念」全是替身。已上市标的 PE 普遍 100–300x 或为负,是典型「主题溢价 > 基本面」。
| 公司 | 代码 | 市值(亿元) | 2025营收(YoY) | 2025净利(YoY) | 毛利率 | AI芯片占比 | TTM PE | Fwd PE(26E/27E) | 估值热度/Setup | 护城河 |
|---|---|---|---|---|---|---|---|---|---|---|
| 寒武纪 | 688256 | ~7168 ⚠️ | 64.97亿 (+453%) | 20.59亿 (扭亏) | ~56% | ~100% | ~200–320x ⚠️ | 91–137x / 51–73x | 🔥🔥🔥🔥🔥 · 2/5 | Narrow |
| 海光信息 | 688041 | ~6886 ⚠️ | 143.77亿 (+57%) | 25.45亿 (+32%) | ~59–64% | DCU 上升中(CPU 仍主力) | ~200x+ ⚠️ | ~100x 级 ⚠️ | 🔥🔥🔥🔥 · 2.5/5 | Narrow→Wide |
| 摩尔线程 | 688795 | ~3003 (06-17) | 未稳定披露 | 亏损 | 低 | ~100% | 负(-350) | 仍亏 | 🔥🔥🔥🔥🔥 · 1.5/5 | Narrow |
| 华为昇腾 | 未上市 | N/A | 体外·未披露 | N/A | — | ~50% 国产份额 | N/A | N/A | 赛道最强 · 不可买 | Wide(体系) |
⚠️ A 股市值/PE 来自东财·同花顺·理杏仁中文站,单位「亿元」、PE 为 TTM/扣非混用口径,必须在 Wind 复核后方可引用。市值取最近可得口径(寒武纪/海光 2026-04 末,摩尔线程 2026-06-17 实时)。壁仞(01-02)、天数(01-08) 在港股、沐曦科创板已上市,不入本 A 股表。
「做不出」还是「高端做不好 + 量产爬不动」? 答案已从前者转向后者。910C / 思元 590 / DCU 都已量产兑现——能做出可用产品。真正的矛盾转移到三处:① HBM(被断供,华为转自研 HiBL/HiZQ 是最大看点,良率待验证);② SMIC 先进制程良率(910D 的 5nm 是试金石,910C 良率仅 ~30–50%);③ 产能爬坡 + 生态迁移成本(CANN/MUSA vs CUDA 十几年差距)。高端旗舰对标仍差一代半到两代(B200 FP16 算力约 910C 的 3 倍)。
| 卡脖子环节 | 全球垄断方 | 国产现状 / 玩家 | 难点 / 时间点 |
|---|---|---|---|
| 先进制程代工 | 台积电 N3/N2(已断供华为) | 中芯国际 7nm(N+2 DUV 多重曝光);910C 良率 ~30–50% | 5nm(910D)良率是最大不确定性,2026 量产 |
| HBM | SK海力士/三星/美光(已断供) | 华为自研 HiBL 1.0 / HiZQ 2.0(950PR 起,2026Q1) | 绕开封锁的标志性事件,但量产良率/带宽兑现度待验证 |
| EDA / x86 授权 | Synopsys/Cadence;AMD(海光 x86 来源) | EDA 国产化补课中;海光 AMD 授权延续性存疑 | 美方进一步收紧是尾部风险 |
| 软件生态 | NVIDIA CUDA(15+ 年) | 华为 CANN(2026-05 全面开源,适配 200+ 模型)/ 摩尔线程 MUSA / 寒武纪自研 | 最难量化的差距,迁移成本是劝退点 |
推理需求接棒训练(token 复利增长),主权 AI + 企业渗透加速,2027 capex 仍 >+50%。ASIC 蚕食慢于预期,NVDA 数据中心毛利稳在 70%+。
触发:企业端从 pilot 大规模转生产部署;推理 token 经济性证实;Rubin 量产顺利。NVDA 重回 30x+ Fwd PE。
需求强劲但增速二阶导 2027 转负;ASIC 美元份额温和升到 ~20–25%;NVDA 份额从 ~90% 滑向 ~75% 但绝对收入仍涨。供需在 2027 接近平衡点,估值横盘消化业绩。
最可能路径:NVDA Fwd PE 20–25x 区间震荡,靠盈利增长而非估值扩张。AVGO 为 ASIC 主受益者跑赢。
「四线收敛」兑现:capex 见顶 + CoWoS/HBM 扩产后过剩价格战 + 折旧假设崩塌(利润重算)+ 循环融资断裂。GPU 从短缺翻转为过剩,估值 + 盈利双杀。
触发:任一 hyperscaler 下修 capex 指引;GPU 现货价松动;CoreWeave/Oracle 现金流承压。NVDA Fwd PE 跌破 15x。
| 类别 | 风险 | 概率 | 影响 |
|---|---|---|---|
| 需求 | Hyperscaler capex 2027 二阶导转负 / 见顶 | 中 | 高 |
| 需求 | 推理 ROI 证伪(MIT NANDA「95% 试点零回报」、$600B 缺口扩大),capex 主动收缩 | 中 | 高 |
| 需求 | 自研 ASIC 分流 merchant GPU 份额(NVDA 推理份额或 2028 降至 20–30%) | 高 | 中 |
| 供给 | CoWoS/HBM 2026–27 翻倍扩产后 2027 转过剩、价格战 | 中 | 高 |
| 供给 | 内存涨价侵蚀系统毛利(已在 MSFT/META 指引中显现) | 高 | 中 |
| 政策 | 对华管制再收紧 / 中国反制本土替代;H200 抽成模式不确定 | 中 | 中 |
| 技术 | Rubin/Rubin Ultra 量产或良率延迟(600kW Kyber 散热/供电) | 低-中 | 高 |
| 估值 | GPU 实际寿命 2–3 年坐实 → 折旧假设崩塌 → 盈利重算下修 → 估值/盈利双杀 | 中 | 高 |
| 估值 | 循环融资闭环(NVDA-OpenAI-Oracle-CoreWeave)某一环断裂 | 低-中 | 高 |
GPU/加速器是 AI 链护城河最宽、利润池最肥的环节,需求与传导链是真的、NVIDIA 估值倍数不极端——这不是 2000 年思科式的估值泡沫,而是一场关于「2027 盈利可持续性」的赌局。本轮风险已从「现在贵不贵」转移到「分母会不会断崖」:capex 增速二阶导、CoWoS/HBM 扩产后供需反转、5–6 年折旧假设、循环订单缩水,四条线恰好都指向 2027。
分层立场(空头不软化):
· NVIDIA — 标配(Setup 4/5):最优质资产,倍数已被增长消化到历史低位,但 $5T 体量 + 2027 四线收敛压顶,不追高、回调是机会。
· Broadcom — 关注(3.5/5):ASIC 放量的隐形赢家,年化 $43B、backlog $73B,是 base case 最确定的受益者。
· AMD / Marvell — 谨慎(2.5/5):故事对、价格透支,Fwd PE 58–61 且分析师目标价已低于现价,回调风险高于龙头。
· Intel — 回避(2/5):AI 加速器赛道的出局者,上涨靠 Foundry/困境反转期权,与 Gaudi 无关。
· 国产(寒武纪/海光/摩尔线程)— 主题溢价 ≥ 基本面,全部 ≤2.5/5:业绩真兑现但 PE 100–300x 或为负,处「兑现 < 预期」危险区间;最强基本面(华为昇腾)不可买。
赛道整体 Setup 3/5——优质但已含高预期,2027 是分水岭。