行业研究报告 · INDUSTRY PRIMER

GPU / AI 加速器赛道:算力心脏
谁印钞、谁追赶、谁是泡沫

AI 数据中心的「主芯片」环节——通用 GPU(NVIDIA / AMD)与定制 ASIC(Broadcom / Marvell 给 Google·Amazon·Microsoft·Meta 代工)的同台竞逐。它是 Hyperscaler CapEx 砸下来的第一落点,向下游拉动 HBM、CoWoS、光模块、PCB 四大配件。本篇把这条传导链量化讲透,并给出空头不软化的估值判断。

研究日期 2026-06-17数据口径 2025 年报 + 最新一季 + 最新股价 框架 13 节 Industry Primer用途 内部研究参考 · 非投资建议
TL;DR · 一页纸结论

0030 秒读懂 GPU / AI 加速器赛道

是什么:AI 算力的「主芯片」,分通用 GPU(一卡通吃)和定制 ASIC(hyperscaler 自研、专用)两条路线。多大:加速器芯片 TAM 2024 约 $160B(GPU $130B + ASIC $18B),2033 看 $604B(Bloomberg Intelligence,2026-01)。谁赢:NVIDIA 仍是绝对龙头(AI 加速器份额 ~80%+),但份额从 ~90% 边际下滑,定制 ASIC 是结构性第二增长极。我的观点需求与传导链是真的、估值倍数不极端,但 2027 是「四线收敛」的考验年——这不是估值泡沫,是盈利可持续性的赌局。

~$160B
加速器芯片 TAM(2024)
→2033 $604B · Bloomberg Intel 2026-01
6.5/10
行业吸引力评分
成长极强,但周期/集中度/估值拖累
NVDA·AVGO
最该看的标的
通用龙头 + ASIC 隐形赢家
3/5
赛道 Setup score
优质资产,但价格已含高预期
行业吸引力评分卡(加权 0–10,权重已标)。composite ≈ 6.5/10:一个「成长满分但被周期性、客户集中度、估值热度拖累」的赛道——比光模块/PCB 的护城河更宽,但比它们更贵、更接近供需反转点。
越高越好风险维度(越高=越差)
长期成长 25%
9.5
行业盈利能力 20%
8.8
周期/波动风险 15%
6.5
政策/地缘 10%
6.0
颠覆风险(ASIC替代) 10%
5.5
资本密集度 10%
4.5
客户集中度 10%
7.5

注:风险维度的柱长代表「风险大小」(越长越差),已在加权时反向计入。权重为本报告主观设定,供横向比较其他 primer 用。

DEFINITION & BOUNDARY

01定义与边界(先把篱笆扎好)

本篇口径 = 数据中心 AI 训练/推理加速器主芯片:通用 GPU(NVIDIA、AMD)+ 云厂定制 ASIC/XPU(Google TPU、AWS Trainium、Microsoft Maia、Meta MTIA,由 Broadcom/Marvell 协同设计)+ 国产 AI 芯片(昇腾、寒武纪、海光、摩尔线程等)。

明确不含(OUT):① 消费级游戏显卡;② CPU(除非作为加速器配套,如 NVIDIA Grace、华为鲲鹏);③ 边缘/端侧 NPU(手机、汽车);④ AI 推理初创的小众架构(Groq/Cerebras/SambaNova 只在分歧章节作为「推理芯片」论据出现,不计入主 TAM);⑤ 上游配件本身(HBM/CoWoS/光模块/PCB——各有独立 primer,本篇只讲 GPU 对它们的传导)。这条边界是防 TAM 注水的第一道闸门:把「AI 数据中心整体市场(含土建电力)$344B」当成「加速器芯片市场」是最常见的口径错误。

✎ 基础概念速查

先把全篇会反复出现的名词一次讲清(读者聪明但非专家)

GPU(通用图形处理器):一张卡通吃训练+推理+任意模型,灵活但贵、毛利高。NVIDIA/AMD 卖的就是它。
ASIC / XPU(专用集成电路):为固定任务定制的芯片,省成本省电但不灵活。Google TPU、AWS Trainium 都是 ASIC。
CUDA:NVIDIA 的软件生态(库+框架+开发者),15+ 年积累,是其最深护城河——别人芯片再快,迁移成本也劝退。
HBM(高带宽内存):堆叠在 GPU 旁的高速内存,AI 芯片的「油箱」。一颗 B200 配 8 颗 HBM、约占物料成本 45%。供给侧=内存五厂。
CoWoS(台积电先进封装):把 GPU 裸片和 HBM 封装到一块大基板上的工艺。当前最硬的供给瓶颈,被 NVIDIA「包场」>60%。
NVLink / NVL72:NVIDIA 的机柜内高速互联(scale-up),把 72 颗 GPU 连成「一台超大 GPU」,用铜缆、不用光模块。是 ASIC 短期难复制的优势。
Scale-up vs Scale-out:机柜内互联(scale-up,铜)vs 跨机柜组网(scale-out,光模块)。光模块只在 scale-out 用——这点常被搞混。
Hyperscaler:超大云厂(微软/谷歌/亚马逊/Meta/Oracle)。既是 GPU 最大买家,又自研 ASIC 反制 NVIDIA,关系是「又买又造」。
Forward PE / PEG:前瞻市盈率(按未来一年预期盈利)/ PE÷增速。高增长股看 TTM PE 会误导,必须看 Forward。NVDA Fwd PE ~22、PEG ~0.47。
Scaling Law(规模定律):模型越大越聪明的经验规律。近期争议是「预训练撞墙」,转向「后训练 + 推理时计算」三条新 scaling 律。
推理 vs 训练:训练=一次性「造模型」(脉冲需求);推理=持续「用模型」(复利需求)。推理已占算力约 2/3,是 ASIC 的主场。
循环融资:NVIDIA 投 OpenAI → OpenAI 买 NVIDIA 芯片 的资金闭环,被质疑虚增需求。是 2027 反转论的关键论据。
THE AI THESIS · 传导链

02它在 AI 大主线里扮演什么角色 + 传导链拆解

GPU/加速器是 Hyperscaler CapEx 砸下来的第一落点:每一美元数据中心资本开支,约一半最终落到「加速器 + 其紧贴的 HBM/封装」上。理解这个赛道的关键,是看清 GPU 出货如何逐级传导到下游四大配件——这也是它和你已做的四篇报告的接口。

A. NVIDIA 产品路线图:已回到「一年一更」节奏

GTC 2025(2025-03)NVIDIA 把路线图画到 2028,确立年度 tick-tock:Blackwell(2024)→ Blackwell Ultra(2025)→ Rubin(2026)→ Rubin Ultra(2027)→ Feynman(2028)。每代对 HBM/CoWoS 的「单卡消耗」都在抬升,这是配件环节量价齐升的根。(NextPlatform 2025-03-19;Tom's Hardware 2025-03)

代际型号量产制程HBM 配置封装单卡功耗机柜形态相对上代
HopperH100 / H2002022H2 / 2024H1TSMC 4N80GB HBM3 / 141GB HBM3eCoWoS-S700WHGX 8-GPU基准
BlackwellB200 (GB200 NVL72)2024H2 起TSMC 4NP180–192GB HBM3e(8 stack)CoWoS-L 3.3×~1,000WGB200 NVL72FP4 推理 ~5× H100
Blackwell UltraB300 (GB300 NVL72)2025H2 量产TSMC 4NP288GB HBM3e(8 stack)CoWoS-L~1,400WGB300 NVL72比 GB200 再 +50%
RubinR100 / VR200 NVL1442026H2(Q1'27 放量)TSMC N3288GB HBM4(8 stack)CoWoS-L 4×~1.8–2.3kW ⚠️VR200 NVL144~5× Blackwell
Rubin UltraNVL576「Kyber」2027H2N3/N2 级1TB HBM4eCoWoS-L 更大未公布(更高)NVL576 600kW 机柜~14× GB300 NVL72
Feynman(2028)2028A16/1.6nm下一代 HBM(未官宣)路线图远期

⚠️ Rubin 单卡功耗 1.8–2.3kW 各源不一、且为路线图非量产值。所有规格来源:NextPlatform / Tom's Hardware / TrendForce / Wedbush / VideoCardz,2025-03 至 2026-01。HBM stack 数 H100 最多 6 → B 系/Rubin 固定 8;容量 80GB→288GB(3.6×);CoWoS interposer 面积 1×→3.3×→4× reticle,即每代单卡吃掉的封装面积近乎翻倍

B. 单 GPU / 单机柜 BOM 传导拆解(本报告核心)

B200 单卡GB200 NVL72 单机柜(72 GPU) 为两个锚点,量化 GPU 出货如何变成下游四个环节的收入。下面所有 BOM 数字均为第三方逆向估算(Epoch AI / SemiAnalysis / Morgan Stanley),NVIDIA 不披露 BOM,引用须保留「估算」字样。

① HBM —— 单卡最大外购件

  • 每颗 B200 用 8 stack / 192GB HBM3e,价值 ~$2,900($15/GB 中值)
  • HBM 占 GPU 制造 BOM ~45%;B200 总制造成本 ~$6,400
  • Rubin 换 HBM4(2048-bit I/O,~13TB/s),单卡 HBM 价值进一步上行;SK海力士拿下 Rubin HBM4 ~60–70% 份额

Epoch AI / Silicon Analysts / Wedbush,2026

② CoWoS —— 当前最硬瓶颈

  • 每颗 B200 占 CoWoS-L interposer ~3.3× reticle(~2,831mm²);Rubin 4× reticle
  • 单卡封装价值 ~$1,100(B200)
  • 台积电 CoWoS 月产能 2024 ~35K → 2026 目标 ~125–130K wafer;NVIDIA 锁 >60%
  • 物理根因:reticle 占用逐代翻倍 → 即便产能翻倍,单位 GPU 吃掉的面积也在涨 → 紧张持续到 2027

3DInCites / SemiWiki / Digitimes,2025–26

③ 光模块 —— 配比取决于 scale-out

  • 机柜内(scale-up)= 纯铜,0 光模块:GB200 NVL72 用 5,184 根无源铜缆连 72 GPU(省 ~20kW 光器件功耗)
  • 跨机柜(scale-out)才上光模块:1 NIC/GPU;机柜间 1.6T 方案 ≈ 1:9、800G ≈ 1:18
  • 市面「每 GPU 2.5–3 个 800G 模块」是整网多层胖树口径,高度依赖集群规模——这是全报告弹性最大的数字

SemiAnalysis / FiberMall,2025–26

④ PCB / 载板 —— Rubin 起价值量陡升

  • GB200 NVL72 整机柜 PCB 价值 ~$35,100/rack
  • Rubin 机柜 ~$116,700/rack(+233%):算力板 22→26 层、CCL M7→M8、交换 tray 24→32 层、新增 44 层 midplane
  • 层数↑ + CCL 等级↑ + 全新模块三重叠加 → Rubin 代单机柜 PCB 价值翻 3 倍

Morgan Stanley / SemiAnalysis,2026

一图看懂传导(GB200 NVL72 单机柜 = 72 GPU):
├─ HBM:72 × 8 stack = 576 stack HBM3e ≈ 72 × $2,900 ≈ $209K HBM 价值(→ 内存五厂)
├─ CoWoS:72 × 3.3 reticle interposer(台积电,NVIDIA 包场 >60%)(→ 先进封装)
├─ 光模块:机柜内 0(5,184 根铜缆);机柜间 scale-out 才上 800G/1.6T(→ 光模块)
└─ PCB:~$35K/rack(Rubin 代 → ~$117K/rack,+233%)(→ PCB/CCL)
把 NVIDIA 季度数据中心营收 ~$75B × ~75% 来自 Blackwell 机柜,乘以这些单位价值量,就能倒推四个配件环节的季度收入弹性——这就是「需求引擎」的传导机制。

C. 需求侧锚点:增速没放缓,反而加速

$75.2B
NVDA 数据中心营收 Q1 FY27
+92% YoY · 2026-05-20
$95.2B
供应承诺(近翻倍)
NVIDIA Newsroom 2026
$11B/季
网络营收(光/交换)
YoY >3.5× · 印证传导
>$30B
主权 AI 全年
同比 >3× · 对冲客户集中
VALUE CHAIN & BOTTLENECK

03产业链拆解 + 供给瓶颈到底在哪

上游
IP / 制造 / 关键料:台积电(N3/N4 先进制程 + CoWoS 封装,最硬瓶颈)、内存五厂(HBM)、ASML/应材(设备)、Arm(CPU IP)。利润高地 + 卡脖子都在这层。
中游
芯片设计(本篇主角):通用 GPU = NVIDIA / AMD;定制 ASIC 设计服务 = Broadcom / Marvell(替 Google/Amazon/MS/Meta 流片);国产 = 昇腾/寒武纪/海光/摩尔线程。最肥的利润池在这里(NVIDIA 数据中心毛利率 ~75%)。
下游
需求方:Hyperscaler(微软/谷歌/亚马逊/Meta/Oracle)+ 主权 AI + 新云(CoreWeave)+ 企业。它们既是 GPU 最大买家,又自研 ASIC 反制——「又买又造」是本赛道最核心的竞合关系。
✎ 直接回答:供给瓶颈到底在 CoWoS / HBM 还是 GPU die 本身?

2026 的供给闸门排序 = CoWoS ≥ HBM > 先进制程 die > 机柜组装

① CoWoS 先进封装——最硬瓶颈。多个卖方明确「真正的闸门不是 HBM stack,而是把 die+HBM 封成大芯片的 CoWoS 系统」。台积电 CoWoS 2025 全年至 2026 持续 sold out,NVIDIA 锁 >60%;物理根因是每代 reticle 占用翻倍,扩产追不上单位消耗。

② HBM——同样售罄,但有三供应商缓冲。全行业 2026 已售罄(SK海力士/三星/美光),但相对 CoWoS 多了供应商冗余;风险在 HBM4 切换期份额高度集中于 SK海力士(60–70%)。

③ GPU die(台积电 N4/N3)——紧但非最硬。先进逻辑产能与 CoWoS 同步扩,是「贵」更甚于「缺」。

④ 机柜级组装(GB200 NVL72 液冷/良率)——2024–25 初期痛点,2026 已大幅缓解,从「瓶颈」降级为「工程化已解决」。

Medium/elongated_musk 2026-04 · FusionWW 2026 · SemiAnalysis · Digitimes 2025-12 · Wedbush CES 2026

So what:瓶颈在封装/内存而非 die,意味着两件事——(1) 谁卡住 CoWoS/HBM,谁就分走 GPU 的超额利润(台积电、SK海力士议价权极强);(2) 一旦 2026–2027 这两个环节产能翻倍扩出来,GPU 可能从「分配制短缺」快速翻转为「价格战过剩」,这是 §08 分歧 5(周期反转)的物理基础。

MARKET SIZE · GPU vs ASIC

04市场规模 + 通用 GPU vs 定制 ASIC 的份额演化

这个赛道 TAM 口径极其混乱(最低 $12B、最高 >$200B),根源是「加速器芯片 / AI 服务器 / AI 基础设施 / AI 数据中心」四个篮子被混用。本篇主锚 = 加速器芯片口径(2024 ~$160B),其余作并列对照,绝不平均。

口径层级含义代表数字来源
A. 加速器芯片(本篇主锚)GPU + ASIC 纯硅2024 ~$160B → 2033 $604BBloomberg Intelligence / SemiAnalysis 2026-01
B. 数据中心加速器(含系统溢价)板卡/系统收入2026 >$200BSilicon Analysts / TrendForce 2026-05
C. AI 基础设施支出服务器+网络+存储2024 $153B → 2025 $318BIDC 2026
D. AI 数据中心整体含土建/电力/冷却2025 $147B(Grand View)vs $344B(M&M)两家差 2.3×,纯口径不同

⚠️ 口径冲突最大陷阱:第三方调研机构(Precedence/IntelMarketResearch)的「2025 $10–15B」与 Bloomberg/SemiAnalysis 的「$160B」差一个数量级,几乎确定是「只统计外采加速卡 vs 含系统」的口径差,不可与 A/B 层混用

NVIDIA 份额:百分比边际下滑,绝对收入仍涨

GPU 口径份额
~92%
AI 加速器整体(含ASIC)
~80%+
2026 预测(AMD+ASIC 放量)
~73–75%

carboncredits 2025 / Silicon Analysts 2026 / alatirok 2026-05。绝对收入锚:NVDA FY26 全年 $215.9B,Q1 FY27 数据中心单季 $75.2B(+92%)。

通用 GPU vs ASIC:出货量份额 ≠ 美元份额(最大误读源)。美元份额:2024 GPU ~$130B(88%)/ ASIC ~$18B(12%)→ 2033 GPU $290B(48%)/ ASIC $165B(27%)。即 ASIC 美元份额从 ~12% 升到 ~27%,但 GPU 仍是单一最大、接近一半,2030 前无机构预测 ASIC 美元份额过半。 ② 出货量份额:2026 ASIC 服务器占加速器服务器出货 27.8%;2026 ASIC 出货 +44.6% vs GPU +16.1%(近 3 倍增速);2027–2028 ASIC 出货量将首次反超 GPU。 说「ASIC 干掉 GPU」是出货量叙事,不是美元叙事——因为 ASIC 单价远低于 GPU rack。Bloomberg Intelligence 2026-01 / TrendForce 2026-05
✎ 各超大厂自研 ASIC 进度:哪些真上量、哪些还在 PPT
芯片状态量化
Google TPU v7 Ironwood真上量Anthropic 单家部署 >100 万颗;Google 计划 2026 出货 430 万→2027 1000 万→2028 >3500 万颗(Broadcom 协同)
AWS Trainium 2/3真上量Trainium3 2026 年中放量,MS 估 2026 出货 >150 万颗;Trainium4 已发布(Marvell/Annapurna)
Microsoft Maia 200早期放量2026-01 发布,曾延期;TSMC 3nm / 216GB HBM3e
Meta MTIA部分上量(仅自用)v2 量产、v3 2026 年中、v4 年末送样;全部内部消费,不外卖
OpenAI(Broadcom)设计/早期偏 design phase,目标 2029 部署 10GW;尚未量产

投资含义:「ASIC 放量」在二级市场最直接的纯标的是 AVGO / MRVL,而非 hyperscaler 本身——后者的 ASIC 多为内部消费,不直接抢公开市场。Tom's Hardware / Introl / TrendForce 2026

COMPETITIVE LANDSCAPE & MOAT

05竞争格局 + 护城河

Porter 五力(各一句)

护城河评级

公司护城河来源一句话
NVIDIAWideCUDA + NVLink + 迭代速度 + 全 workload 灵活性15+ 年生态锁定,最深单点壁垒;年度架构节奏 + 据报道收购推理芯片公司 Groq 补推理(2025-12,金额未官宣 ⚠️)
BroadcomWide定制 ASIC 设计 IP + 客户深绑(Google 7 代)与 Marvell 合占 ASIC 协同设计 ~95%;卖铲子给铲子厂
AMDNarrow→Wide开放 ROCm(仍弱于 CUDA)+ 性价比MI355X 在中小 LLM 推理对 B200 有 TCO 竞争力,但对 GB200 NVL72 前沿场景不具竞争力
MarvellNarrow定制 XPU(AWS/MS)+ 光 DSPASIC 第二名,但体量小 Broadcom 一个数量级;GAAP 盈利质量弱
IntelNone→Narrow(被侵蚀)Gaudi 软件栈弃守、产品线终结——AI 加速器赛道的出局者
AMD 追赶的真实差距:软件上 ROCm 标准 LLM 推理已达 H100 吞吐的 90–95%、MLPerf 6.0 上 MI355X 对 B200 部分项达 97–119%,差距在收窄;但系统级(NVL72 rack-scale 互联)仍是结构性落后,MI400/Helios 要 2026H2 才可能对标 Rubin VR200 NVL144。Intel Gaudi 为何掉队:成本削减导致软件生态弃守(2025-12 停止维护 Gaudi 开源驱动)——软件栈断供 = 失去开发者 = 出局。
U.S. & GLOBAL EQUITIES

06海外重点公司(USD)

5 家放一张表。注意财年口径:NVDA/MRVL 财年领先自然年约 11 个月(FY2027 ≈ 自然年 2026);AVGO 财年 11 月结束;AMD/INTC 用自然年。

公司代码市值最新季营收(YoY)最新季净利(YoY)毛利率AI/DC占比TTM PEFwd PE估值热度/Setup护城河
NVIDIANVDA$5.08T$81.6B (+85%)
总营收;DC $75.2B
$58.3B (+211%)74.9%DC 92%~32–3821–24hot(PEG低) · 4/5Wide
AMDAMD$892B$10.3B (+38%)~$1.4B (+98%)53%DC 56%高(存疑)58–61very hot · 2.5/5Narrow→Wide
BroadcomAVGO$1.81T$22.2B (+48%)~$8B 区间77.1%AI半导体 68%65.625–33hot · 3.5/5Wide
MarvellMRVL$230B$2.42B (+28%)$34.5M GAAP / $718M nonGAAP~50%DC 76%n/m(GAAP)58very hot · 2.5/5Narrow
IntelINTC~$595B ⚠️$13.6B (+7%)−$3.73B 亏损~低Gaudi 个位数%n/m高(存疑)投机性 · 2/5None→Narrow

价格/估值 as-of 2026-06-12 至 06-16,来源 StockTitan / CNBC / stockanalysis / GuruFocus / Broadcom IR。⚠️ Intel ~$595B 市值处历史高位、与亏损背离,疑 Foundry/18A + 美政府入股题材驱动,建议二次核验。Fwd PE 跨源差异(AVGO 25 NTM vs 33 FY 口径)已给区间。

NVIDIA · 当前估值是否泡沫?

Fwd PE 21–24、PEG 0.47,对一个营收 +85%、净利 +211%、毛利 75% 的公司,是「增收+增利」高质量增长。数据中心增速未放缓、反而加速(FY26 四季 $44B→$47B→$57B→$68B,Q1 FY27 跳 $81.6B)。结论:不构成传统估值泡沫。真风险在 $5T 体量下的绝对增长可持续性 + 客户 CapEx 周期 + ASIC 分流,不在倍数本身。

Broadcom · AI ASIC 已是巨兽

Q2 FY26 AI 半导体营收 $10.8B(+143%)占总营收 68% → 年化 run-rate ~$43B(远超 $12B)。Q3 指引 AI 半导体 $16B;FY26 全年指引 $56B;管理层重申 FY27 >$100B,backlog $73B。客户已确认:Google/Meta/字节/OpenAI/Anthropic;Apple/xAI 仍属传闻(已按潜在处理,不抄媒体夸大)。

中美「同图对比」:纯赛道标的,折美元(FX ≈ 7.1 RMB/USD)

口径说明:取通用 GPU/ASIC 纯标的——美国 NVDA/AMD/AVGO/MRVL(🌐),中国 寒武纪/海光/摩尔线程(🇨🇳)。Intel 已剔除(AI 加速器仅个位数占比 + 亏损,是赛道落后者,留在图里会误导)。AVGO/MRVL 为 ASIC 设计模式(非自卖 GPU),保留但标注。中国市值/营收由人民币 ÷7.1 折算。

🇨🇳 中国 A 股🌐 海外

① 市值(美元 bn,对数感知——NVDA 已是其余总和数倍)

NVIDIA 🌐
$5,080
Broadcom 🌐
$1,810
AMD 🌐
$892
Marvell 🌐
$230
寒武纪 🇨🇳
$101
海光信息 🇨🇳
$97
摩尔线程 🇨🇳
$42

② 营收(最新年/年化,美元 bn)

NVIDIA 🌐
$216
Broadcom 🌐
$64
AMD 🌐
~$41
Marvell 🌐
~$10
海光信息 🇨🇳(含CPU)
$20.2(143.8亿元)
寒武纪 🇨🇳
$9.1(65.0亿元)
摩尔线程 🇨🇳
小/亏损

注:中国营收数字括号内为人民币原值(亿元)。海光营收含 CPU(非纯 AI 芯片)。

③ 净利润(最新年,美元 bn)

NVIDIA 🌐
$117
Broadcom 🌐
$23.1
AMD 🌐
~$5.5
海光信息 🇨🇳
$3.6(25.4亿元)
寒武纪 🇨🇳
$2.9(20.6亿元)
Marvell 🌐
~0(GAAP)
摩尔线程 🇨🇳
亏损

④ 毛利率(%)

Broadcom 🌐
77.1%
NVIDIA 🌐
74.9%
海光信息 🇨🇳
~61%
寒武纪 🇨🇳
~56%
AMD 🌐
53%
Marvell 🌐
~50%

⑤ Forward PE(越低越便宜,🇨🇳 普遍贵到离谱)

寒武纪 🇨🇳(26E)
91–137x
海光信息 🇨🇳
~100x
AMD 🌐
58–61x
Marvell 🌐
58x
Broadcom 🌐
25–33x
NVIDIA 🌐
21–24x
摩尔线程 🇨🇳
亏损·n/m
P/S vs P/E 的读法(营收 ≠ 价值):中国名字在「市值/营收」上看着不小(海光营收 $20B vs Marvell $10B),但 美元利润和毛利质量被美国名字碾压,而 Forward PE 反而高 2–5 倍。市场为美国龙头付的是利润 + 护城河 + 兑现确定性;为中国名字付的是「国产替代」主题溢价。同样讲 AI 芯片,NVDA Fwd PE 22 是「增长被消化到历史低位」,寒武纪 100x+ 是「把 2027 都透支」——这是全表最锋利的对比。
CHINA A-SHARE & COMPANY PROFILES

07A 股 / 国产公司 + 公司名片

2025 是「国产 GPU 集体冲线」的资本元年:寒武纪扭亏、摩尔线程/沐曦科创板上市、壁仞/天数港股上市。华为昇腾是真正的体量王者(占国产出货近一半),但未上市——A 股能买到的「华为概念」全是替身。已上市标的 PE 普遍 100–300x 或为负,是典型「主题溢价 > 基本面」。

公司代码市值(亿元)2025营收(YoY)2025净利(YoY)毛利率AI芯片占比TTM PEFwd PE(26E/27E)估值热度/Setup护城河
寒武纪688256~7168 ⚠️64.97亿 (+453%)20.59亿 (扭亏)~56%~100%~200–320x ⚠️91–137x / 51–73x🔥🔥🔥🔥🔥 · 2/5Narrow
海光信息688041~6886 ⚠️143.77亿 (+57%)25.45亿 (+32%)~59–64%DCU 上升中(CPU 仍主力)~200x+ ⚠️~100x 级 ⚠️🔥🔥🔥🔥 · 2.5/5Narrow→Wide
摩尔线程688795~3003 (06-17)未稳定披露亏损~100%负(-350)仍亏🔥🔥🔥🔥🔥 · 1.5/5Narrow
华为昇腾未上市N/A体外·未披露N/A~50% 国产份额N/AN/A赛道最强 · 不可买Wide(体系)

⚠️ A 股市值/PE 来自东财·同花顺·理杏仁中文站,单位「亿元」、PE 为 TTM/扣非混用口径,必须在 Wind 复核后方可引用。市值取最近可得口径(寒武纪/海光 2026-04 末,摩尔线程 2026-06-17 实时)。壁仞(01-02)、天数(01-08) 在港股、沐曦科创板已上市,不入本 A 股表。

逐家大白话名片

华为昇腾 未上市 Wide

💡 国产唯一全栈闭环:芯片+超节点+CANN 生态+国家队+大厂锁单,单卡输 NVIDIA 但靠堆集群打平
产品:910B(7nm,对标 A100,出货主力)/ 910C(双 die,FP16 约 H100 的 80%)/ 910D(5nm,2026 量产);CloudMatrix 384 超节点(384 颗 910C)。
客户/AI 抓手:字节、阿里等大厂集中锁单;2025 出货 81.2 万张(国产近一半);Bernstein 估 2026 占中国 AI 芯片 ~50%。
现状:基本面赛道第一,但未上市,A 股无纯正标的;最大看点是 950PR 起改用自研 HBM 绕开封锁(良率待验证)。

寒武纪 688256 Narrow

💡 A 股最纯正 AI 芯片龙头,「中国英伟达」叙事载体——但价格已把 2027 透支
来头:2016 成立、北京、中科院系,2020 科创板上市。思元 590/690(约对标 A100/H20)。
业绩:2025 营收 65 亿(+453%)、净利 20.6 亿(首次年度盈利);26Q1 营收 28.85 亿(+160%)。基本面真兑现了。
现状:市值 ~7168 亿、PE 数百倍;任何业绩/政策低于预期都是戴维斯双杀。Setup 2/5。

海光信息 688041 Narrow→Wide

💡 CPU+DCU 双轮,AMD x86 血统带来生态兼容优势,比寒武纪基本面更厚实
来头:源自 2016 与 AMD 的 Zen 架构合资授权(也是最大隐患);CPU 现金牛 + DCU 切 AI 算力。深算三号已上市、四号研发中。
业绩:2025 营收 143.8 亿(+57%)、净利 25.5 亿(+32%)、毛利 ~60%;26Q1 营收 40 亿级。
现状:⚠️ 与中科曙光合并已于 2025-12 终止(不是推进中);市值 ~6886 亿仍贵。Setup 2.5/5。

摩尔线程 688795 Narrow

💡 「国产 GPU 第一股」+ NVIDIA 系创始团队,产品形态最全、基本面最空
来头:创始人张建中(NVIDIA 前中国区总经理);2025-12 登陆科创板(受理到上市 88 天),募资净额 75.76 亿。全功能 GPU(MTT S 系列)。
现状仍亏损(TTM PE -350),市值 ~3003 亿、股价 639 元;上市一周就拿募资理财引发泡沫争议。MUSA 生态成熟度低于寒武纪/华为。
定调:纯主题泡沫标本,Setup 1.5/5,回调风险最大。
KEY DEBATES · VARIANT VIEW

08市场最大的 5 个分歧 + 我方观点(★ 本篇 alpha)

分歧 1 · 通用 GPU vs 定制 ASIC 的份额演化

市场共识

ASIC 高速崛起、「干掉 GPU」;hyperscaler 自研全面替代 NVIDIA。

我方观点

分清两个口径:出货量份额 2027–28 ASIC 确会反超 GPU(增速近 3 倍);但美元份额从 ~12% 仅升到 ~27%(2033),GPU 仍单一最大、近一半。「ASIC 干掉 GPU」是出货量叙事,不是美元叙事。二级市场最直接受益的是 AVGO/MRVL(设计服务),不是 hyperscaler 自用芯片。

判据 / 催化剂

盯三指标:①ASIC 美元份额是否破 30%(2028 共识线);②任一 ASIC 是否拿到外部客户(Anthropic 用 TPU 已是先例);③AMD MI400 是否补上训练差距。证伪:若 ASIC 美元份额 2028 前破 40%,则我方偏保守。
分歧 2 · GPU 供给瓶颈在 CoWoS/HBM 还是 GPU die 本身

市场共识

笼统说「GPU 缺货」,归因模糊。

我方观点

瓶颈明确在先进封装 CoWoS ≥ HBM,不在 die。台积电 CoWoS 2026 售罄、NVIDIA 锁 >60%,reticle 占用逐代翻倍是物理根因。die(N3/N4)是「贵」非「缺」。含义:卡住封装/内存的台积电、SK海力士分走 GPU 超额利润。

判据 / 催化剂

跟 CoWoS 月产能爬坡(35K→130K wafer)、HBM4 量产时点、H100/H200 交期是否收敛到 <20 周。证伪:若 2026H2 交期已收敛但 GPU 仍缺,则瓶颈转移到 die/组装。
分歧 3 · Scaling law 是否撞墙 + 推理芯片是否会赢

市场共识

预训练撞墙(Ilya「scaling 时代结束」)→ AI 需求见顶 → GPU 需求塌。

我方观点

预训练单一 scaling 确实放缓,但转向「预训练+后训练+推理时计算」三条 scaling 律,需求换形态没死。推理已占算力 ~2/3,2030 看 75%。这利好 ASIC、对 NVIDIA 中性偏空(推理是 ASIC 主场,NVIDIA 推理份额或 2028 降至 20–30%);但 NVIDIA 据报道收购推理芯片公司 Groq(2025-12,金额未官宣)正面补推理。

判据 / 催化剂

推理/训练算力占比是否如期向 75/25 漂移;NVIDIA 推理份额是否真掉到 2028 的 20–30%。证伪:若推理需求被 ASIC + 价格战吃掉利润,则通用 GPU 利润池缩水。
分歧 4 · NVIDIA 当前估值是否泡沫

市场共识

「$5T 市值 = 巨型泡沫,像 2000 年思科」。

我方观点

不是估值泡沫,是盈利可持续性的赌局。Fwd PE ~22、PEG 0.47,处自身历史偏低分位;思科顶部是 472x 纯倍数泡沫、盈利没跟上,NVDA 倍数温和、盈利真兑现。风险已从「现在贵不贵」转移到「2027 盈利会不会断崖」。只对比 P/E 会误导读者。

判据 / 催化剂

Fwd PE 历史分位、前 4–5 大客户收入占比、数据中心毛利率是否被 ASIC 压缩。证伪:若数据中心毛利率跌破 65% 或客户集中度恶化 + 增速腰斩,则倍数 + 盈利双杀。
分歧 5 · 2027 cycle 反转风险(★ 最锋利)

市场共识

AI 超级周期长期向上,capex 持续加码。

我方观点

2027 是「四线收敛」的考验年:①capex 增速二阶导转负(2026 +77% → 2027 或仅 +50%,市场领先 6–12 个月定价);②CoWoS/HBM 2026–27 翻倍扩产后供需反转、价格战;③GPU 5–6 年折旧假设若被坐实过松(实际寿命 2–3 年),hyperscaler 利润重算下修;④NVDA-OpenAI 循环订单已从 $100B 缩到 ~$30B,闭环降温。四条线恰好都指向 2027。多头靠推理接棒 + 主权 AI + 企业渗透对冲。

判据 / 催化剂

关键观测:hyperscaler capex YoY 增速拐点 + 内存价格 + 自研 ASIC 份额 + 企业端从 pilot 转规模部署。证伪(不会反转):若推理 token 经济性成立、企业渗透加速(Anthropic ARR 15 个月 $1B→$30B),需求从脉冲转复利,反转推迟。
DEEP DIVE · CHINA vs U.S.

09卡脖子深拆:国产 AI 芯片做到哪一步

✎ 直接回答

「做不出」还是「高端做不好 + 量产爬不动」? 答案已从前者转向后者。910C / 思元 590 / DCU 都已量产兑现——能做出可用产品。真正的矛盾转移到三处:① HBM(被断供,华为转自研 HiBL/HiZQ 是最大看点,良率待验证);② SMIC 先进制程良率(910D 的 5nm 是试金石,910C 良率仅 ~30–50%);③ 产能爬坡 + 生态迁移成本(CANN/MUSA vs CUDA 十几年差距)。高端旗舰对标仍差一代半到两代(B200 FP16 算力约 910C 的 3 倍)。

卡脖子环节全球垄断方国产现状 / 玩家难点 / 时间点
先进制程代工台积电 N3/N2(已断供华为)中芯国际 7nm(N+2 DUV 多重曝光);910C 良率 ~30–50%5nm(910D)良率是最大不确定性,2026 量产
HBMSK海力士/三星/美光(已断供)华为自研 HiBL 1.0 / HiZQ 2.0(950PR 起,2026Q1)绕开封锁的标志性事件,但量产良率/带宽兑现度待验证
EDA / x86 授权Synopsys/Cadence;AMD(海光 x86 来源)EDA 国产化补课中;海光 AMD 授权延续性存疑美方进一步收紧是尾部风险
软件生态NVIDIA CUDA(15+ 年)华为 CANN(2026-05 全面开源,适配 200+ 模型)/ 摩尔线程 MUSA / 寒武纪自研最难量化的差距,迁移成本是劝退点
BULL / BASE / BEAR

10三情景与证伪条件(以 NVIDIA 为锚)

▲ 牛市

概率 ~30%

推理需求接棒训练(token 复利增长),主权 AI + 企业渗透加速,2027 capex 仍 >+50%。ASIC 蚕食慢于预期,NVDA 数据中心毛利稳在 70%+。

触发:企业端从 pilot 大规模转生产部署;推理 token 经济性证实;Rubin 量产顺利。NVDA 重回 30x+ Fwd PE。

● 基准

概率 ~50%

需求强劲但增速二阶导 2027 转负;ASIC 美元份额温和升到 ~20–25%;NVDA 份额从 ~90% 滑向 ~75% 但绝对收入仍涨。供需在 2027 接近平衡点,估值横盘消化业绩。

最可能路径:NVDA Fwd PE 20–25x 区间震荡,靠盈利增长而非估值扩张。AVGO 为 ASIC 主受益者跑赢。

▼ 熊市

概率 ~20%

「四线收敛」兑现:capex 见顶 + CoWoS/HBM 扩产后过剩价格战 + 折旧假设崩塌(利润重算)+ 循环融资断裂。GPU 从短缺翻转为过剩,估值 + 盈利双杀。

触发:任一 hyperscaler 下修 capex 指引;GPU 现货价松动;CoreWeave/Oracle 现金流承压。NVDA Fwd PE 跌破 15x。

CATALYST CALENDAR

11催化剂日历(2026 H2 – 2028)

2026-08-20关键
Marvell 财报——定制 ASIC(Trainium/Maia)放量最纯标的,最早定调。
2026-08-26关键
NVIDIA Q2 FY27 财报——Blackwell→Rubin 过渡期 guidance、中国口径。
2026-09-03关键
Broadcom 财报——自研 XPU + 网络,Google/Meta ASIC 订单能见度、FY27 >$100B 指引复核。
2026 H2利好
NVIDIA Rubin(R100/VR200 NVL144)量产,首配 HBM4;AMD MI400 + Helios 机柜量产(OpenAI 6GW 大单启动)。
2026 年中关键
HBM4 量产(2048-bit);台积电 CoWoS 月产能爬到 ~125–130K wafer(瓶颈缓解 = 双刃剑)。
2026 Q4利好
寒武纪/海光年度业绩窗口;昇腾 950DT(自研 HBM);Google Ironwood TPU 持续放量。
2026 持续利空
美国对华出口管制窗口(H200 对华抽成 25%,但 NVDA 实际对华收入已近归零);内存涨价侵蚀系统毛利(已现于 MSFT/META 指引)。
2027利空/关键
「四线收敛」考验年:capex 增速二阶导、CoWoS/HBM 供给反转、折旧重算、循环订单缩水同时收敛。CoWoS 产能升至 ~170K wafer(过剩论据来源)。
2027 H2利好
NVIDIA Rubin Ultra(NVL576「Kyber」600kW 机柜);AMD MI500。
2028远期
NVIDIA Feynman(TSMC A16/1.6nm);ASIC 出货量预计已反超 GPU。
RISKS & BOTTOM LINE

12风险矩阵 + 结论

类别风险概率影响
需求Hyperscaler capex 2027 二阶导转负 / 见顶
需求推理 ROI 证伪(MIT NANDA「95% 试点零回报」、$600B 缺口扩大),capex 主动收缩
需求自研 ASIC 分流 merchant GPU 份额(NVDA 推理份额或 2028 降至 20–30%)
供给CoWoS/HBM 2026–27 翻倍扩产后 2027 转过剩、价格战
供给内存涨价侵蚀系统毛利(已在 MSFT/META 指引中显现)
政策对华管制再收紧 / 中国反制本土替代;H200 抽成模式不确定
技术Rubin/Rubin Ultra 量产或良率延迟(600kW Kyber 散热/供电)低-中
估值GPU 实际寿命 2–3 年坐实 → 折旧假设崩塌 → 盈利重算下修 → 估值/盈利双杀
估值循环融资闭环(NVDA-OpenAI-Oracle-CoreWeave)某一环断裂低-中

一句话定调

GPU/加速器是 AI 链护城河最宽、利润池最肥的环节,需求与传导链是真的、NVIDIA 估值倍数不极端——这不是 2000 年思科式的估值泡沫,而是一场关于「2027 盈利可持续性」的赌局。本轮风险已从「现在贵不贵」转移到「分母会不会断崖」:capex 增速二阶导、CoWoS/HBM 扩产后供需反转、5–6 年折旧假设、循环订单缩水,四条线恰好都指向 2027。

分层立场(空头不软化):
· NVIDIA — 标配(Setup 4/5):最优质资产,倍数已被增长消化到历史低位,但 $5T 体量 + 2027 四线收敛压顶,不追高、回调是机会
· Broadcom — 关注(3.5/5):ASIC 放量的隐形赢家,年化 $43B、backlog $73B,是 base case 最确定的受益者。
· AMD / Marvell — 谨慎(2.5/5):故事对、价格透支,Fwd PE 58–61 且分析师目标价已低于现价,回调风险高于龙头。
· Intel — 回避(2/5):AI 加速器赛道的出局者,上涨靠 Foundry/困境反转期权,与 Gaudi 无关。
· 国产(寒武纪/海光/摩尔线程)— 主题溢价 ≥ 基本面,全部 ≤2.5/5:业绩真兑现但 PE 100–300x 或为负,处「兑现 < 预期」危险区间;最强基本面(华为昇腾)不可买。

赛道整体 Setup 3/5——优质但已含高预期,2027 是分水岭。

免责与数据口径:内部研究参考,非投资建议;空头观点不软化、护城河评级与情景概率为本报告判断。主用口径:加速器芯片 TAM(Bloomberg Intelligence/SemiAnalysis 2026-01);财务为 2025 年报 + 最新一季 + 2026-06 中旬股价。必须复核项:(1) A 股市值/PE 来自东财·同花顺·理杏仁中文站,单位与 TTM/扣非口径混乱,引用前务必在 Wind/彭博复核;(2) Intel ~$595B 市值与亏损背离,疑题材驱动,需二次核验;(3) 所有 GPU BOM 拆解(HBM $2,900 / CoWoS $1,100 / 总成本 $6,400)为 Epoch AI/SemiAnalysis 逆向估算,非 NVIDIA 披露;(4) Rubin 单卡功耗、光模块:GPU 配比为弹性最大、最依赖假设的数字。主要来源:NVIDIA/AMD/Broadcom/Marvell/Intel 财报与 IR · NextPlatform · SemiAnalysis · Morgan Stanley · TrendForce · Bloomberg Intelligence · IDC · Epoch AI · Wedbush · CNBC · 东方财富 · 新浪财经 · 财新 · 理杏仁。