GPU / AI 加速器赛道行业研究

TL;DR · 一页纸结论

0030 秒读懂 GPU / AI 加速器赛道

是什么：AI 算力的「主芯片」，分通用 GPU（一卡通吃）和定制 ASIC（hyperscaler 自研、专用）两条路线。多大：加速器芯片 TAM 2024 约 $160B（GPU $130B + ASIC $18B），2033 看 $604B（Bloomberg Intelligence，2026-01）。谁赢：NVIDIA 仍是绝对龙头（AI 加速器份额 ~80%+），但份额从 ~90% 边际下滑，定制 ASIC 是结构性第二增长极。我的观点：需求与传导链是真的、估值倍数不极端，但 2027 是「四线收敛」的考验年——这不是估值泡沫，是盈利可持续性的赌局。

~$160B

加速器芯片 TAM（2024）

→2033 $604B · Bloomberg Intel 2026-01

6.5/10

行业吸引力评分

成长极强，但周期/集中度/估值拖累

NVDA·AVGO

最该看的标的

通用龙头 + ASIC 隐形赢家

3/5

赛道 Setup score

优质资产，但价格已含高预期

行业吸引力评分卡（加权 0–10，权重已标）。composite ≈ 6.5/10：一个「成长满分但被周期性、客户集中度、估值热度拖累」的赛道——比光模块/PCB 的护城河更宽，但比它们更贵、更接近供需反转点。

越高越好风险维度（越高=越差）

长期成长 25%

9.5

行业盈利能力 20%

8.8

周期/波动风险 15%

6.5

政策/地缘 10%

6.0

颠覆风险(ASIC替代) 10%

5.5

资本密集度 10%

4.5

客户集中度 10%

7.5

注：风险维度的柱长代表「风险大小」（越长越差），已在加权时反向计入。权重为本报告主观设定，供横向比较其他 primer 用。

本篇在你的研究矩阵里的位置：GPU 是整条 AI 链的「需求引擎落点」。需求侧看 Hyperscaler CapEx；GPU 向下拉动的配件分别见先进封装 CoWoS、内存五厂 HBM（MU/SK Hynix/Samsung）、光模块、PCB；国产替代独立成篇见国产芯片算力替代。本篇重点写 GPU 如何把 CapEx 传导到这四个配件环节（§02）。

DEFINITION & BOUNDARY

01定义与边界（先把篱笆扎好）

本篇口径 = 数据中心 AI 训练/推理加速器主芯片：通用 GPU（NVIDIA、AMD）+ 云厂定制 ASIC/XPU（Google TPU、AWS Trainium、Microsoft Maia、Meta MTIA，由 Broadcom/Marvell 协同设计）+ 国产 AI 芯片（昇腾、寒武纪、海光、摩尔线程等）。

明确不含（OUT）：① 消费级游戏显卡；② CPU（除非作为加速器配套，如 NVIDIA Grace、华为鲲鹏）；③ 边缘/端侧 NPU（手机、汽车）；④ AI 推理初创的小众架构（Groq/Cerebras/SambaNova 只在分歧章节作为「推理芯片」论据出现，不计入主 TAM）；⑤ 上游配件本身（HBM/CoWoS/光模块/PCB——各有独立 primer，本篇只讲 GPU 对它们的传导）。这条边界是防 TAM 注水的第一道闸门：把「AI 数据中心整体市场（含土建电力）$344B」当成「加速器芯片市场」是最常见的口径错误。

✎ 基础概念速查

先把全篇会反复出现的名词一次讲清（读者聪明但非专家）

GPU（通用图形处理器）：一张卡通吃训练+推理+任意模型，灵活但贵、毛利高。NVIDIA/AMD 卖的就是它。

ASIC / XPU（专用集成电路）：为固定任务定制的芯片，省成本省电但不灵活。Google TPU、AWS Trainium 都是 ASIC。

CUDA：NVIDIA 的软件生态（库+框架+开发者），15+ 年积累，是其最深护城河——别人芯片再快，迁移成本也劝退。

HBM（高带宽内存）：堆叠在 GPU 旁的高速内存，AI 芯片的「油箱」。一颗 B200 配 8 颗 HBM、约占物料成本 45%。供给侧=内存五厂。

CoWoS（台积电先进封装）：把 GPU 裸片和 HBM 封装到一块大基板上的工艺。当前最硬的供给瓶颈，被 NVIDIA「包场」>60%。

NVLink / NVL72：NVIDIA 的机柜内高速互联（scale-up），把 72 颗 GPU 连成「一台超大 GPU」，用铜缆、不用光模块。是 ASIC 短期难复制的优势。

Scale-up vs Scale-out：机柜内互联（scale-up，铜）vs 跨机柜组网（scale-out，光模块）。光模块只在 scale-out 用——这点常被搞混。

Hyperscaler：超大云厂（微软/谷歌/亚马逊/Meta/Oracle）。既是 GPU 最大买家，又自研 ASIC 反制 NVIDIA，关系是「又买又造」。

Forward PE / PEG：前瞻市盈率（按未来一年预期盈利）/ PE÷增速。高增长股看 TTM PE 会误导，必须看 Forward。NVDA Fwd PE ~22、PEG ~0.47。

Scaling Law（规模定律）：模型越大越聪明的经验规律。近期争议是「预训练撞墙」，转向「后训练 + 推理时计算」三条新 scaling 律。

推理 vs 训练：训练=一次性「造模型」（脉冲需求）；推理=持续「用模型」（复利需求）。推理已占算力约 2/3，是 ASIC 的主场。

循环融资：NVIDIA 投 OpenAI → OpenAI 买 NVIDIA 芯片的资金闭环，被质疑虚增需求。是 2027 反转论的关键论据。

THE AI THESIS · 传导链

02它在 AI 大主线里扮演什么角色 + 传导链拆解

GPU/加速器是 Hyperscaler CapEx 砸下来的第一落点：每一美元数据中心资本开支，约一半最终落到「加速器 + 其紧贴的 HBM/封装」上。理解这个赛道的关键，是看清 GPU 出货如何逐级传导到下游四大配件——这也是它和你已做的四篇报告的接口。

A. NVIDIA 产品路线图：已回到「一年一更」节奏

GTC 2025（2025-03）NVIDIA 把路线图画到 2028，确立年度 tick-tock：Blackwell（2024）→ Blackwell Ultra（2025）→ Rubin（2026）→ Rubin Ultra（2027）→ Feynman（2028）。每代对 HBM/CoWoS 的「单卡消耗」都在抬升，这是配件环节量价齐升的根。（NextPlatform 2025-03-19；Tom's Hardware 2025-03）

代际	型号	量产	制程	HBM 配置	封装	单卡功耗	机柜形态	相对上代
Hopper	H100 / H200	2022H2 / 2024H1	TSMC 4N	80GB HBM3 / 141GB HBM3e	CoWoS-S	700W	HGX 8-GPU	基准
Blackwell	B200 (GB200 NVL72)	2024H2 起	TSMC 4NP	180–192GB HBM3e（8 stack）	CoWoS-L 3.3×	~1,000W	GB200 NVL72	FP4 推理 ~5× H100
Blackwell Ultra	B300 (GB300 NVL72)	2025H2 量产	TSMC 4NP	288GB HBM3e（8 stack）	CoWoS-L	~1,400W	GB300 NVL72	比 GB200 再 +50%
Rubin	R100 / VR200 NVL144	2026H2（Q1'27 放量）	TSMC N3	288GB HBM4（8 stack）	CoWoS-L 4×	~1.8–2.3kW ⚠️	VR200 NVL144	~5× Blackwell
Rubin Ultra	NVL576「Kyber」	2027H2	N3/N2 级	1TB HBM4e	CoWoS-L 更大	未公布（更高）	NVL576 600kW 机柜	~14× GB300 NVL72
Feynman	（2028）	2028	A16/1.6nm	下一代 HBM（未官宣）	—	—	—	路线图远期

⚠️ Rubin 单卡功耗 1.8–2.3kW 各源不一、且为路线图非量产值。所有规格来源：NextPlatform / Tom's Hardware / TrendForce / Wedbush / VideoCardz，2025-03 至 2026-01。HBM stack 数 H100 最多 6 → B 系/Rubin 固定 8；容量 80GB→288GB（3.6×）；CoWoS interposer 面积 1×→3.3×→4× reticle，即每代单卡吃掉的封装面积近乎翻倍。

B. 单 GPU / 单机柜 BOM 传导拆解（本报告核心）

以 B200 单卡 和 GB200 NVL72 单机柜（72 GPU） 为两个锚点，量化 GPU 出货如何变成下游四个环节的收入。下面所有 BOM 数字均为第三方逆向估算（Epoch AI / SemiAnalysis / Morgan Stanley），NVIDIA 不披露 BOM，引用须保留「估算」字样。

① HBM —— 单卡最大外购件

每颗 B200 用 8 stack / 192GB HBM3e，价值 ~$2,900（$15/GB 中值）
HBM 占 GPU 制造 BOM ~45%；B200 总制造成本 ~$6,400
Rubin 换 HBM4（2048-bit I/O，~13TB/s），单卡 HBM 价值进一步上行；SK海力士拿下 Rubin HBM4 ~60–70% 份额

Epoch AI / Silicon Analysts / Wedbush，2026

供给侧详见美光 / SK Hynix / Samsung 内存五厂研报

② CoWoS —— 当前最硬瓶颈

每颗 B200 占 CoWoS-L interposer ~3.3× reticle（~2,831mm²）；Rubin 4× reticle
单卡封装价值 ~$1,100（B200）
台积电 CoWoS 月产能 2024 ~35K → 2026 目标 ~125–130K wafer；NVIDIA 锁 >60%
物理根因：reticle 占用逐代翻倍 → 即便产能翻倍，单位 GPU 吃掉的面积也在涨 → 紧张持续到 2027

3DInCites / SemiWiki / Digitimes，2025–26

详见先进封装 CoWoS 行业研究

③ 光模块 —— 配比取决于 scale-out

机柜内（scale-up）= 纯铜，0 光模块：GB200 NVL72 用 5,184 根无源铜缆连 72 GPU（省 ~20kW 光器件功耗）
跨机柜（scale-out）才上光模块：1 NIC/GPU；机柜间 1.6T 方案 ≈ 1:9、800G ≈ 1:18
市面「每 GPU 2.5–3 个 800G 模块」是整网多层胖树口径，高度依赖集群规模——这是全报告弹性最大的数字

SemiAnalysis / FiberMall，2025–26

详见光模块行业研究

④ PCB / 载板 —— Rubin 起价值量陡升

GB200 NVL72 整机柜 PCB 价值 ~$35,100/rack
Rubin 机柜 ~$116,700/rack（+233%）：算力板 22→26 层、CCL M7→M8、交换 tray 24→32 层、新增 44 层 midplane
层数↑ + CCL 等级↑ + 全新模块三重叠加 → Rubin 代单机柜 PCB 价值翻 3 倍

Morgan Stanley / SemiAnalysis，2026

详见 PCB 行业研究

一图看懂传导（GB200 NVL72 单机柜 = 72 GPU）：
├─ HBM：72 × 8 stack = 576 stack HBM3e ≈ 72 × $2,900 ≈ $209K HBM 价值（→ 内存五厂）
├─ CoWoS：72 × 3.3 reticle interposer（台积电，NVIDIA 包场 >60%）（→ 先进封装）
├─ 光模块：机柜内 0（5,184 根铜缆）；机柜间 scale-out 才上 800G/1.6T（→ 光模块）
└─ PCB：~$35K/rack（Rubin 代 → ~$117K/rack，+233%）（→ PCB/CCL）
把 NVIDIA 季度数据中心营收 ~$75B × ~75% 来自 Blackwell 机柜，乘以这些单位价值量，就能倒推四个配件环节的季度收入弹性——这就是「需求引擎」的传导机制。

C. 需求侧锚点：增速没放缓，反而加速

$75.2B

NVDA 数据中心营收 Q1 FY27

+92% YoY · 2026-05-20

$95.2B

供应承诺（近翻倍）

NVIDIA Newsroom 2026

$11B/季

网络营收（光/交换）

YoY >3.5× · 印证传导

>$30B

主权 AI 全年

同比 >3× · 对冲客户集中

VALUE CHAIN & BOTTLENECK

03产业链拆解 + 供给瓶颈到底在哪

上游

IP / 制造 / 关键料：台积电（N3/N4 先进制程 + CoWoS 封装，最硬瓶颈）、内存五厂（HBM）、ASML/应材（设备）、Arm（CPU IP）。利润高地 + 卡脖子都在这层。

中游

芯片设计（本篇主角）：通用 GPU = NVIDIA / AMD；定制 ASIC 设计服务 = Broadcom / Marvell（替 Google/Amazon/MS/Meta 流片）；国产 = 昇腾/寒武纪/海光/摩尔线程。最肥的利润池在这里（NVIDIA 数据中心毛利率 ~75%）。

下游

需求方：Hyperscaler（微软/谷歌/亚马逊/Meta/Oracle）+ 主权 AI + 新云（CoreWeave）+ 企业。它们既是 GPU 最大买家，又自研 ASIC 反制——「又买又造」是本赛道最核心的竞合关系。

✎ 直接回答：供给瓶颈到底在 CoWoS / HBM 还是 GPU die 本身？

2026 的供给闸门排序 = CoWoS ≥ HBM > 先进制程 die > 机柜组装

① CoWoS 先进封装——最硬瓶颈。多个卖方明确「真正的闸门不是 HBM stack，而是把 die+HBM 封成大芯片的 CoWoS 系统」。台积电 CoWoS 2025 全年至 2026 持续 sold out，NVIDIA 锁 >60%；物理根因是每代 reticle 占用翻倍，扩产追不上单位消耗。

② HBM——同样售罄，但有三供应商缓冲。全行业 2026 已售罄（SK海力士/三星/美光），但相对 CoWoS 多了供应商冗余；风险在 HBM4 切换期份额高度集中于 SK海力士（60–70%）。

③ GPU die（台积电 N4/N3）——紧但非最硬。先进逻辑产能与 CoWoS 同步扩，是「贵」更甚于「缺」。

④ 机柜级组装（GB200 NVL72 液冷/良率）——2024–25 初期痛点，2026 已大幅缓解，从「瓶颈」降级为「工程化已解决」。

Medium/elongated_musk 2026-04 · FusionWW 2026 · SemiAnalysis · Digitimes 2025-12 · Wedbush CES 2026

So what：瓶颈在封装/内存而非 die，意味着两件事——(1) 谁卡住 CoWoS/HBM，谁就分走 GPU 的超额利润（台积电、SK海力士议价权极强）；(2) 一旦 2026–2027 这两个环节产能翻倍扩出来，GPU 可能从「分配制短缺」快速翻转为「价格战过剩」，这是 §08 分歧 5（周期反转）的物理基础。

MARKET SIZE · GPU vs ASIC

04市场规模 + 通用 GPU vs 定制 ASIC 的份额演化

这个赛道 TAM 口径极其混乱（最低 $12B、最高 >$200B），根源是「加速器芯片 / AI 服务器 / AI 基础设施 / AI 数据中心」四个篮子被混用。本篇主锚 = 加速器芯片口径（2024 ~$160B），其余作并列对照，绝不平均。

口径层级	含义	代表数字	来源
A. 加速器芯片（本篇主锚）	GPU + ASIC 纯硅	2024 ~$160B → 2033 $604B	Bloomberg Intelligence / SemiAnalysis 2026-01
B. 数据中心加速器（含系统溢价）	板卡/系统收入	2026 >$200B	Silicon Analysts / TrendForce 2026-05
C. AI 基础设施支出	服务器+网络+存储	2024 $153B → 2025 $318B	IDC 2026
D. AI 数据中心整体	含土建/电力/冷却	2025 $147B（Grand View）vs $344B（M&M）	两家差 2.3×，纯口径不同

⚠️ 口径冲突最大陷阱：第三方调研机构（Precedence/IntelMarketResearch）的「2025 $10–15B」与 Bloomberg/SemiAnalysis 的「$160B」差一个数量级，几乎确定是「只统计外采加速卡 vs 含系统」的口径差，不可与 A/B 层混用。

NVIDIA 份额：百分比边际下滑，绝对收入仍涨

GPU 口径份额

~92%

AI 加速器整体（含ASIC）

~80%+

2026 预测（AMD+ASIC 放量）

~73–75%

carboncredits 2025 / Silicon Analysts 2026 / alatirok 2026-05。绝对收入锚：NVDA FY26 全年 $215.9B，Q1 FY27 数据中心单季 $75.2B（+92%）。

通用 GPU vs ASIC：出货量份额 ≠ 美元份额（最大误读源）。 ① 美元份额：2024 GPU ~$130B（88%）/ ASIC ~$18B（12%）→ 2033 GPU $290B（48%）/ ASIC $165B（27%）。即 ASIC 美元份额从 ~12% 升到 ~27%，但 GPU 仍是单一最大、接近一半，2030 前无机构预测 ASIC 美元份额过半。 ② 出货量份额：2026 ASIC 服务器占加速器服务器出货 27.8%；2026 ASIC 出货 +44.6% vs GPU +16.1%（近 3 倍增速）；2027–2028 ASIC 出货量将首次反超 GPU。说「ASIC 干掉 GPU」是出货量叙事，不是美元叙事——因为 ASIC 单价远低于 GPU rack。Bloomberg Intelligence 2026-01 / TrendForce 2026-05

✎ 各超大厂自研 ASIC 进度：哪些真上量、哪些还在 PPT

芯片	状态	量化
Google TPU v7 Ironwood	真上量	Anthropic 单家部署 >100 万颗；Google 计划 2026 出货 430 万→2027 1000 万→2028 >3500 万颗（Broadcom 协同）
AWS Trainium 2/3	真上量	Trainium3 2026 年中放量，MS 估 2026 出货 >150 万颗；Trainium4 已发布（Marvell/Annapurna）
Microsoft Maia 200	早期放量	2026-01 发布，曾延期；TSMC 3nm / 216GB HBM3e
Meta MTIA	部分上量（仅自用）	v2 量产、v3 2026 年中、v4 年末送样；全部内部消费，不外卖
OpenAI（Broadcom）	设计/早期	偏 design phase，目标 2029 部署 10GW；尚未量产

投资含义：「ASIC 放量」在二级市场最直接的纯标的是 AVGO / MRVL，而非 hyperscaler 本身——后者的 ASIC 多为内部消费，不直接抢公开市场。Tom's Hardware / Introl / TrendForce 2026

COMPETITIVE LANDSCAPE & MOAT

05竞争格局 + 护城河

Porter 五力（各一句）

供应商议价力（高）：上游卡在台积电（CoWoS）+ SK海力士/美光（HBM），2026 产能售罄，定价权在上游。
客户议价力（升）：买方是少数超大 hyperscaler，自研 ASIC 正是它们对 NVIDIA 的反制筹码。
替代威胁（升）：ASIC（TPU/Trainium/Maia/MTIA）+ 推理专用芯片（Groq/Cerebras）在固定 workload 上侵蚀。
新进入威胁（中）：CUDA 生态 + 资本/制程门槛极高，但 Broadcom/Marvell 以「设计服务 + 客户自带需求」绕过软件壁垒。
同业竞争（中高）：NVIDIA vs AMD vs hyperscaler ASIC 三线，全行业转入年度迭代节奏。

护城河评级

公司	护城河	来源	一句话
NVIDIA	Wide	CUDA + NVLink + 迭代速度 + 全 workload 灵活性	15+ 年生态锁定，最深单点壁垒；年度架构节奏 + 据报道收购推理芯片公司 Groq 补推理（2025-12，金额未官宣 ⚠️）
Broadcom	Wide	定制 ASIC 设计 IP + 客户深绑（Google 7 代）	与 Marvell 合占 ASIC 协同设计 ~95%；卖铲子给铲子厂
AMD	Narrow→Wide	开放 ROCm（仍弱于 CUDA）+ 性价比	MI355X 在中小 LLM 推理对 B200 有 TCO 竞争力，但对 GB200 NVL72 前沿场景不具竞争力
Marvell	Narrow	定制 XPU（AWS/MS）+ 光 DSP	ASIC 第二名，但体量小 Broadcom 一个数量级；GAAP 盈利质量弱
Intel	None→Narrow	（被侵蚀）	Gaudi 软件栈弃守、产品线终结——AI 加速器赛道的出局者

AMD 追赶的真实差距：软件上 ROCm 标准 LLM 推理已达 H100 吞吐的 90–95%、MLPerf 6.0 上 MI355X 对 B200 部分项达 97–119%，差距在收窄；但系统级（NVL72 rack-scale 互联）仍是结构性落后，MI400/Helios 要 2026H2 才可能对标 Rubin VR200 NVL144。Intel Gaudi 为何掉队：成本削减导致软件生态弃守（2025-12 停止维护 Gaudi 开源驱动）——软件栈断供 = 失去开发者 = 出局。

U.S. & GLOBAL EQUITIES

06海外重点公司（USD）

5 家放一张表。注意财年口径：NVDA/MRVL 财年领先自然年约 11 个月（FY2027 ≈ 自然年 2026）；AVGO 财年 11 月结束；AMD/INTC 用自然年。

公司	代码	市值	最新季营收(YoY)	最新季净利(YoY)	毛利率	AI/DC占比	TTM PE	Fwd PE	估值热度/Setup	护城河
NVIDIA	NVDA	$5.08T	$81.6B (+85%) 总营收;DC $75.2B	$58.3B (+211%)	74.9%	DC 92%	~32–38	21–24	hot(PEG低) · 4/5	Wide
AMD	AMD	$892B	$10.3B (+38%)	~$1.4B (+98%)	53%	DC 56%	高(存疑)	58–61	very hot · 2.5/5	Narrow→Wide
Broadcom	AVGO	$1.81T	$22.2B (+48%)	~$8B 区间	77.1%	AI半导体 68%	65.6	25–33	hot · 3.5/5	Wide
Marvell	MRVL	$230B	$2.42B (+28%)	$34.5M GAAP / $718M nonGAAP	~50%	DC 76%	n/m(GAAP)	58	very hot · 2.5/5	Narrow
Intel	INTC	~$595B ⚠️	$13.6B (+7%)	−$3.73B 亏损	~低	Gaudi 个位数%	n/m	高(存疑)	投机性 · 2/5	None→Narrow

价格/估值 as-of 2026-06-12 至 06-16，来源 StockTitan / CNBC / stockanalysis / GuruFocus / Broadcom IR。⚠️ Intel ~$595B 市值处历史高位、与亏损背离，疑 Foundry/18A + 美政府入股题材驱动，建议二次核验。Fwd PE 跨源差异（AVGO 25 NTM vs 33 FY 口径）已给区间。

NVIDIA · 当前估值是否泡沫？

Fwd PE 21–24、PEG 0.47，对一个营收 +85%、净利 +211%、毛利 75% 的公司，是「增收+增利」高质量增长。数据中心增速未放缓、反而加速（FY26 四季 $44B→$47B→$57B→$68B，Q1 FY27 跳 $81.6B）。结论：不构成传统估值泡沫。真风险在 $5T 体量下的绝对增长可持续性 + 客户 CapEx 周期 + ASIC 分流，不在倍数本身。

Broadcom · AI ASIC 已是巨兽

Q2 FY26 AI 半导体营收 $10.8B（+143%）占总营收 68% → 年化 run-rate ~$43B（远超 $12B）。Q3 指引 AI 半导体 $16B；FY26 全年指引 $56B；管理层重申 FY27 >$100B，backlog $73B。客户已确认：Google/Meta/字节/OpenAI/Anthropic；Apple/xAI 仍属传闻（已按潜在处理，不抄媒体夸大）。

中美「同图对比」：纯赛道标的，折美元（FX ≈ 7.1 RMB/USD）

口径说明：取通用 GPU/ASIC 纯标的——美国 NVDA/AMD/AVGO/MRVL（🌐），中国寒武纪/海光/摩尔线程（🇨🇳）。Intel 已剔除（AI 加速器仅个位数占比 + 亏损，是赛道落后者，留在图里会误导）。AVGO/MRVL 为 ASIC 设计模式（非自卖 GPU），保留但标注。中国市值/营收由人民币 ÷7.1 折算。

🇨🇳 中国 A 股🌐 海外

① 市值（美元 bn，对数感知——NVDA 已是其余总和数倍）

NVIDIA 🌐

$5,080

Broadcom 🌐

$1,810

AMD 🌐

$892

Marvell 🌐

$230

寒武纪 🇨🇳

$101

海光信息 🇨🇳

$97

摩尔线程 🇨🇳

$42

② 营收（最新年/年化，美元 bn）

NVIDIA 🌐

$216

Broadcom 🌐

$64

AMD 🌐

~$41

Marvell 🌐

~$10

海光信息 🇨🇳(含CPU)

$20.2(143.8亿元)

寒武纪 🇨🇳

$9.1(65.0亿元)

摩尔线程 🇨🇳

小/亏损

注：中国营收数字括号内为人民币原值（亿元）。海光营收含 CPU（非纯 AI 芯片）。

③ 净利润（最新年，美元 bn）

NVIDIA 🌐

$117

Broadcom 🌐

$23.1

AMD 🌐

~$5.5

海光信息 🇨🇳

$3.6(25.4亿元)

寒武纪 🇨🇳

$2.9(20.6亿元)

Marvell 🌐

~0(GAAP)

摩尔线程 🇨🇳

亏损

④ 毛利率（%）

Broadcom 🌐

77.1%

NVIDIA 🌐

74.9%

海光信息 🇨🇳

~61%

寒武纪 🇨🇳

~56%

AMD 🌐

53%

Marvell 🌐

~50%

⑤ Forward PE（越低越便宜，🇨🇳 普遍贵到离谱）

寒武纪 🇨🇳(26E)

91–137x

海光信息 🇨🇳

~100x

AMD 🌐

58–61x

Marvell 🌐

58x

Broadcom 🌐

25–33x

NVIDIA 🌐

21–24x

摩尔线程 🇨🇳

亏损·n/m

P/S vs P/E 的读法（营收 ≠ 价值）：中国名字在「市值/营收」上看着不小（海光营收 $20B vs Marvell $10B），但 美元利润和毛利质量被美国名字碾压，而 Forward PE 反而高 2–5 倍。市场为美国龙头付的是利润 + 护城河 + 兑现确定性；为中国名字付的是「国产替代」主题溢价。同样讲 AI 芯片，NVDA Fwd PE 22 是「增长被消化到历史低位」，寒武纪 100x+ 是「把 2027 都透支」——这是全表最锋利的对比。

CHINA A-SHARE & COMPANY PROFILES

07A 股 / 国产公司 + 公司名片

2025 是「国产 GPU 集体冲线」的资本元年：寒武纪扭亏、摩尔线程/沐曦科创板上市、壁仞/天数港股上市。华为昇腾是真正的体量王者（占国产出货近一半），但未上市——A 股能买到的「华为概念」全是替身。已上市标的 PE 普遍 100–300x 或为负，是典型「主题溢价 > 基本面」。

公司	代码	市值(亿元)	2025营收(YoY)	2025净利(YoY)	毛利率	AI芯片占比	TTM PE	Fwd PE(26E/27E)	估值热度/Setup	护城河
寒武纪	688256	~7168 ⚠️	64.97亿 (+453%)	20.59亿 (扭亏)	~56%	~100%	~200–320x ⚠️	91–137x / 51–73x	🔥🔥🔥🔥🔥 · 2/5	Narrow
海光信息	688041	~6886 ⚠️	143.77亿 (+57%)	25.45亿 (+32%)	~59–64%	DCU 上升中(CPU 仍主力)	~200x+ ⚠️	~100x 级 ⚠️	🔥🔥🔥🔥 · 2.5/5	Narrow→Wide
摩尔线程	688795	~3003 (06-17)	未稳定披露	亏损	低	~100%	负(-350)	仍亏	🔥🔥🔥🔥🔥 · 1.5/5	Narrow
华为昇腾	未上市	N/A	体外·未披露	N/A	—	~50% 国产份额	N/A	N/A	赛道最强 · 不可买	Wide(体系)

⚠️ A 股市值/PE 来自东财·同花顺·理杏仁中文站，单位「亿元」、PE 为 TTM/扣非混用口径，必须在 Wind 复核后方可引用。市值取最近可得口径（寒武纪/海光 2026-04 末，摩尔线程 2026-06-17 实时）。壁仞(01-02)、天数(01-08) 在港股、沐曦科创板已上市，不入本 A 股表。

逐家大白话名片

华为昇腾未上市 Wide

💡 国产唯一全栈闭环：芯片+超节点+CANN 生态+国家队+大厂锁单，单卡输 NVIDIA 但靠堆集群打平

产品：910B（7nm，对标 A100，出货主力）/ 910C（双 die，FP16 约 H100 的 80%）/ 910D（5nm，2026 量产）；CloudMatrix 384 超节点（384 颗 910C）。

客户/AI 抓手：字节、阿里等大厂集中锁单；2025 出货 81.2 万张（国产近一半）；Bernstein 估 2026 占中国 AI 芯片 ~50%。

现状：基本面赛道第一，但未上市，A 股无纯正标的；最大看点是 950PR 起改用自研 HBM 绕开封锁（良率待验证）。

寒武纪 688256 Narrow

💡 A 股最纯正 AI 芯片龙头，「中国英伟达」叙事载体——但价格已把 2027 透支

来头：2016 成立、北京、中科院系，2020 科创板上市。思元 590/690（约对标 A100/H20）。

业绩：2025 营收 65 亿(+453%)、净利 20.6 亿（首次年度盈利）；26Q1 营收 28.85 亿(+160%)。基本面真兑现了。

现状：市值 ~7168 亿、PE 数百倍；任何业绩/政策低于预期都是戴维斯双杀。Setup 2/5。

海光信息 688041 Narrow→Wide

💡 CPU+DCU 双轮，AMD x86 血统带来生态兼容优势，比寒武纪基本面更厚实

来头：源自 2016 与 AMD 的 Zen 架构合资授权（也是最大隐患）；CPU 现金牛 + DCU 切 AI 算力。深算三号已上市、四号研发中。

业绩：2025 营收 143.8 亿(+57%)、净利 25.5 亿(+32%)、毛利 ~60%；26Q1 营收 40 亿级。

现状：⚠️ 与中科曙光合并已于 2025-12 终止（不是推进中）；市值 ~6886 亿仍贵。Setup 2.5/5。

摩尔线程 688795 Narrow

💡 「国产 GPU 第一股」+ NVIDIA 系创始团队，产品形态最全、基本面最空

来头：创始人张建中（NVIDIA 前中国区总经理）；2025-12 登陆科创板（受理到上市 88 天），募资净额 75.76 亿。全功能 GPU（MTT S 系列）。

现状：仍亏损（TTM PE -350），市值 ~3003 亿、股价 639 元；上市一周就拿募资理财引发泡沫争议。MUSA 生态成熟度低于寒武纪/华为。

定调：纯主题泡沫标本，Setup 1.5/5，回调风险最大。

KEY DEBATES · VARIANT VIEW

关键观测：hyperscaler capex YoY 增速拐点 + 内存价格 + 自研 ASIC 份额 + 企业端从 pilot 转规模部署。证伪（不会反转）：若推理 token 经济性成立、企业渗透加速（Anthropic ARR 15 个月 $1B→$30B），需求从脉冲转复利，反转推迟。

DEEP DIVE · CHINA vs U.S.

09卡脖子深拆：国产 AI 芯片做到哪一步

✎ 直接回答

「做不出」还是「高端做不好 + 量产爬不动」？ 答案已从前者转向后者。910C / 思元 590 / DCU 都已量产兑现——能做出可用产品。真正的矛盾转移到三处：① HBM（被断供，华为转自研 HiBL/HiZQ 是最大看点，良率待验证）；② SMIC 先进制程良率（910D 的 5nm 是试金石，910C 良率仅 ~30–50%）；③ 产能爬坡 + 生态迁移成本（CANN/MUSA vs CUDA 十几年差距）。高端旗舰对标仍差一代半到两代（B200 FP16 算力约 910C 的 3 倍）。

卡脖子环节	全球垄断方	国产现状 / 玩家	难点 / 时间点
先进制程代工	台积电 N3/N2（已断供华为）	中芯国际 7nm（N+2 DUV 多重曝光）；910C 良率 ~30–50%	5nm（910D）良率是最大不确定性，2026 量产
HBM	SK海力士/三星/美光（已断供）	华为自研 HiBL 1.0 / HiZQ 2.0（950PR 起，2026Q1）	绕开封锁的标志性事件，但量产良率/带宽兑现度待验证
EDA / x86 授权	Synopsys/Cadence；AMD（海光 x86 来源）	EDA 国产化补课中；海光 AMD 授权延续性存疑	美方进一步收紧是尾部风险
软件生态	NVIDIA CUDA（15+ 年）	华为 CANN（2026-05 全面开源，适配 200+ 模型）/ 摩尔线程 MUSA / 寒武纪自研	最难量化的差距，迁移成本是劝退点

国产替代是独立大主题——本节只做与 GPU 赛道的接口。完整的国产芯片产业链、概念股映射、信创订单与政策博弈，详见《国产芯片算力替代》行业研究。本篇立场：国产基本面赛道最强者是华为昇腾（但不可买），A 股纯正标的估值全部 ≤2.5/5，处「业绩兑现 < 估值预期」危险区间。

BULL / BASE / BEAR

10三情景与证伪条件（以 NVIDIA 为锚）

▲ 牛市

概率 ~30%

推理需求接棒训练（token 复利增长），主权 AI + 企业渗透加速，2027 capex 仍 >+50%。ASIC 蚕食慢于预期，NVDA 数据中心毛利稳在 70%+。

触发：企业端从 pilot 大规模转生产部署；推理 token 经济性证实；Rubin 量产顺利。NVDA 重回 30x+ Fwd PE。

● 基准

概率 ~50%

需求强劲但增速二阶导 2027 转负；ASIC 美元份额温和升到 ~20–25%；NVDA 份额从 ~90% 滑向 ~75% 但绝对收入仍涨。供需在 2027 接近平衡点，估值横盘消化业绩。

最可能路径：NVDA Fwd PE 20–25x 区间震荡，靠盈利增长而非估值扩张。AVGO 为 ASIC 主受益者跑赢。

▼ 熊市

概率 ~20%

「四线收敛」兑现：capex 见顶 + CoWoS/HBM 扩产后过剩价格战 + 折旧假设崩塌（利润重算）+ 循环融资断裂。GPU 从短缺翻转为过剩，估值 + 盈利双杀。

触发：任一 hyperscaler 下修 capex 指引；GPU 现货价松动；CoreWeave/Oracle 现金流承压。NVDA Fwd PE 跌破 15x。

CATALYST CALENDAR

11催化剂日历（2026 H2 – 2028）

2026-08-20关键

Marvell 财报——定制 ASIC（Trainium/Maia）放量最纯标的，最早定调。

2026-08-26关键

NVIDIA Q2 FY27 财报——Blackwell→Rubin 过渡期 guidance、中国口径。

2026-09-03关键

Broadcom 财报——自研 XPU + 网络，Google/Meta ASIC 订单能见度、FY27 >$100B 指引复核。

2026 H2利好

NVIDIA Rubin（R100/VR200 NVL144）量产，首配 HBM4；AMD MI400 + Helios 机柜量产（OpenAI 6GW 大单启动）。

2026 年中关键

HBM4 量产（2048-bit）；台积电 CoWoS 月产能爬到 ~125–130K wafer（瓶颈缓解 = 双刃剑）。

2026 Q4利好

寒武纪/海光年度业绩窗口；昇腾 950DT（自研 HBM）；Google Ironwood TPU 持续放量。

2026 持续利空

美国对华出口管制窗口（H200 对华抽成 25%，但 NVDA 实际对华收入已近归零）；内存涨价侵蚀系统毛利（已现于 MSFT/META 指引）。

2027利空/关键

「四线收敛」考验年：capex 增速二阶导、CoWoS/HBM 供给反转、折旧重算、循环订单缩水同时收敛。CoWoS 产能升至 ~170K wafer（过剩论据来源）。

2027 H2利好

NVIDIA Rubin Ultra（NVL576「Kyber」600kW 机柜）；AMD MI500。

2028远期

NVIDIA Feynman（TSMC A16/1.6nm）；ASIC 出货量预计已反超 GPU。

RISKS & BOTTOM LINE

12风险矩阵 + 结论

类别	风险	概率	影响
需求	Hyperscaler capex 2027 二阶导转负 / 见顶	中	高
需求	推理 ROI 证伪（MIT NANDA「95% 试点零回报」、$600B 缺口扩大），capex 主动收缩	中	高
需求	自研 ASIC 分流 merchant GPU 份额（NVDA 推理份额或 2028 降至 20–30%）	高	中
供给	CoWoS/HBM 2026–27 翻倍扩产后 2027 转过剩、价格战	中	高
供给	内存涨价侵蚀系统毛利（已在 MSFT/META 指引中显现）	高	中
政策	对华管制再收紧 / 中国反制本土替代；H200 抽成模式不确定	中	中
技术	Rubin/Rubin Ultra 量产或良率延迟（600kW Kyber 散热/供电）	低-中	高
估值	GPU 实际寿命 2–3 年坐实 → 折旧假设崩塌 → 盈利重算下修 → 估值/盈利双杀	中	高
估值	循环融资闭环（NVDA-OpenAI-Oracle-CoreWeave）某一环断裂	低-中	高

一句话定调

GPU/加速器是 AI 链护城河最宽、利润池最肥的环节，需求与传导链是真的、NVIDIA 估值倍数不极端——这不是 2000 年思科式的估值泡沫，而是一场关于「2027 盈利可持续性」的赌局。本轮风险已从「现在贵不贵」转移到「分母会不会断崖」：capex 增速二阶导、CoWoS/HBM 扩产后供需反转、5–6 年折旧假设、循环订单缩水，四条线恰好都指向 2027。

分层立场（空头不软化）：
· NVIDIA — 标配（Setup 4/5）：最优质资产，倍数已被增长消化到历史低位，但 $5T 体量 + 2027 四线收敛压顶，不追高、回调是机会。
· Broadcom — 关注（3.5/5）：ASIC 放量的隐形赢家，年化 $43B、backlog $73B，是 base case 最确定的受益者。
· AMD / Marvell — 谨慎（2.5/5）：故事对、价格透支，Fwd PE 58–61 且分析师目标价已低于现价，回调风险高于龙头。
· Intel — 回避（2/5）：AI 加速器赛道的出局者，上涨靠 Foundry/困境反转期权，与 Gaudi 无关。
· 国产（寒武纪/海光/摩尔线程）— 主题溢价 ≥ 基本面，全部 ≤2.5/5：业绩真兑现但 PE 100–300x 或为负，处「兑现 < 预期」危险区间；最强基本面（华为昇腾）不可买。

赛道整体 Setup 3/5——优质但已含高预期，2027 是分水岭。

免责与数据口径：内部研究参考，非投资建议；空头观点不软化、护城河评级与情景概率为本报告判断。主用口径：加速器芯片 TAM（Bloomberg Intelligence/SemiAnalysis 2026-01）；财务为 2025 年报 + 最新一季 + 2026-06 中旬股价。必须复核项：(1) A 股市值/PE 来自东财·同花顺·理杏仁中文站，单位与 TTM/扣非口径混乱，引用前务必在 Wind/彭博复核；(2) Intel ~$595B 市值与亏损背离，疑题材驱动，需二次核验；(3) 所有 GPU BOM 拆解（HBM $2,900 / CoWoS $1,100 / 总成本 $6,400）为 Epoch AI/SemiAnalysis 逆向估算，非 NVIDIA 披露；(4) Rubin 单卡功耗、光模块:GPU 配比为弹性最大、最依赖假设的数字。主要来源：NVIDIA/AMD/Broadcom/Marvell/Intel 财报与 IR · NextPlatform · SemiAnalysis · Morgan Stanley · TrendForce · Bloomberg Intelligence · IDC · Epoch AI · Wedbush · CNBC · 东方财富 · 新浪财经 · 财新 · 理杏仁。

配套阅读（你的 AI 供应链研究矩阵）：Hyperscaler CapEx（需求侧） · 内存五厂 HBM（MU/SKHYNIX/SAMSUNG/SNDK/KIOXIA） · 先进封装 CoWoS · 光模块 · PCB · 国产芯片算力替代。

0030 秒读懂 GPU / AI 加速器赛道

01定义与边界（先把篱笆扎好）

先把全篇会反复出现的名词一次讲清（读者聪明但非专家）

02它在 AI 大主线里扮演什么角色 + 传导链拆解

A. NVIDIA 产品路线图：已回到「一年一更」节奏

B. 单 GPU / 单机柜 BOM 传导拆解（本报告核心）

① HBM —— 单卡最大外购件

② CoWoS —— 当前最硬瓶颈

③ 光模块 —— 配比取决于 scale-out

④ PCB / 载板 —— Rubin 起价值量陡升

C. 需求侧锚点：增速没放缓，反而加速

03产业链拆解 + 供给瓶颈到底在哪

2026 的供给闸门排序 = CoWoS ≥ HBM > 先进制程 die > 机柜组装

04市场规模 + 通用 GPU vs 定制 ASIC 的份额演化

NVIDIA 份额：百分比边际下滑，绝对收入仍涨

05竞争格局 + 护城河

Porter 五力（各一句）

护城河评级

06海外重点公司（USD）

NVIDIA · 当前估值是否泡沫？

Broadcom · AI ASIC 已是巨兽

中美「同图对比」：纯赛道标的，折美元（FX ≈ 7.1 RMB/USD）

07A 股 / 国产公司 + 公司名片

逐家大白话名片

华为昇腾 未上市 Wide

寒武纪 688256 Narrow

海光信息 688041 Narrow→Wide

摩尔线程 688795 Narrow

08市场最大的 5 个分歧 + 我方观点（★ 本篇 alpha）

市场共识

我方观点

判据 / 催化剂

市场共识

我方观点

判据 / 催化剂

市场共识

我方观点

判据 / 催化剂

市场共识

我方观点

判据 / 催化剂

市场共识

我方观点

判据 / 催化剂

09卡脖子深拆：国产 AI 芯片做到哪一步

10三情景与证伪条件（以 NVIDIA 为锚）

▲ 牛市

● 基准

▼ 熊市

11催化剂日历（2026 H2 – 2028）

12风险矩阵 + 结论

一句话定调

华为昇腾未上市 Wide