行业研究报告 · INDUSTRY PRIMER

国产芯片算力替代:管制逼出来的国产化
谁设计、谁制造、差距还有多远

不是市场竞争"打"出来的,是出口管制"逼"出来的需求。当 H100/H200 被锁、国家关基要求 AI 芯片 100% 国产化,一条从昇腾设计到中芯代工、从长鑫 HBM 到上海微电子光刻机的完整国产链条被推到台前——本报告拆解它的玩家、算力、订单与资本市场全景。

研究日期 2026-06-17数据口径 2025 年报 + 最新一季 + 最新股价 框架 16 节 Industry Primer用途 内部研究参考
TL;DR · 一页纸结论

0030 秒读懂国产算力替代

是什么:在美国出口管制下,用国产 AI 加速芯片(华为昇腾、寒武纪等)+ 国产代工/封装/存储/设备,替代英伟达 GPU 撑起中国算力中心。多大:2025 年国产 AI 芯片在中国市场份额首次达 ~41%,对应 AI 芯片 TAM 约 1,425 亿元(2024)→ 2029 约 1.34 万亿。谁赢:短期是设计端"四小龙"+ 昇腾拿份额,但真利润与真瓶颈在制造端(中芯、长鑫 HBM、先进封装、光刻机)。我的观点:主题真实但被严重透支——设计端公司营收基数极小却给上百倍 PE,最硬的卡脖子(EUV 光刻、HBM)3–8 年内无解。

~41%
2025 国产 AI 芯片份额(首破四成)
IDC, 2026-04
6.2/10
行业吸引力评分
政策×成长满分,盈利/资本密度拖累
华为昇腾
最该看的"标的"(未上市,看产业链)
2025 出货 ~81 万颗,国产第一
3/5
Setup score(该不该追)
主题强、估值烫、执行风险大
✎ 行业吸引力评分 · 7 维加权

composite 6.2/10:政策与成长拉满,盈利能力与资本密度是短板

越高越好分值
长期成长 ×25%
9 / 10
行业盈利能力 ×20%
5 / 10
周期/波动(低=好)×15%
5 / 10
政策/地缘顺风 ×10%
10 / 10
颠覆风险(低=好)×10%
5 / 10
资本密度(低=好)×10%
3 / 10
客户集中度(低=好)×10%
4 / 10

一句话驱动:这是一个国家战略级、政策给满分、成长曲线极陡的赛道,但设计端普遍亏损、制造端极重资产、需求高度依赖少数大厂与运营商集采——所以"行业很重要"≠"现在买就对"。

本报告如何回答你的 4 个问题:① 玩家分类(谁设计 / 谁制造)→ §03 产业链 + §8.5 公司名片;② 核心数据(产量·算力·差距)→ §05 供需差距 + §11 卡脖子;③ 业务情况(订单·问题)→ §09 订单与业务实况;④ 资本市场(上市地·受益受害)→ §08 标的 + §12 受益 vs 受害
DEFINITION & BOUNDARY

01定义边界:本报告说的"算力替代"指什么

IN(在范围内):用于 AI 训练/推理的大算力加速芯片(GPU/GPGPU/NPU/ASIC)及其完整国产供应链——芯片设计 → 晶圆代工 → 先进封装 → HBM 存储 → 半导体设备 / EDA / 材料。对标海外为 NVIDIA、AMD(设计)+ 台积电、三星(制造)+ SK 海力士(HBM)。

OUT(不在范围内):手机 SoC、消费电子芯片、车规 MCU、模拟/功率器件、通用 CPU 信创(仅在与算力直接相关处提及,如海光 x86)。这条边界是防"什么都往里塞、把 TAM 吹大"的第一道防线——本报告只谈"撑起智算中心的那块算力芯片及其上游"。

✎ 基础概念速查

先把全篇反复出现的名词一次讲清(读者很聪明,但不必是芯片专家)

GPU / GPGPU / NPU:都是 AI"算力芯片"。GPU 原本画图、被拿来算 AI;GPGPU 是通用化的 GPU(英伟达、摩尔、沐曦);NPU 是专为 AI 设计的芯片(华为昇腾、寒武纪走这条)。
TFLOPS / PFLOPS:每秒浮点运算次数,衡量"算力大小"。1 PFLOPS = 1000 TFLOPS。比较时必须看精度(见下),否则数字会骗人。
FP16 / BF16 / FP8 / FP4:算力的"精度档位"。位数越低、同一颗芯片标称算力越大。厂商爱用低精度报大数——A 家说 FP8 1 PFLOPS、B 家说 FP16 800 TFLOPS,不能直接比。
HBM(高带宽存储):堆叠在 GPU 旁边的"超高速内存",决定大模型喂数据的速度。是 AI 芯片第二硬的卡脖子点,全球被 SK 海力士/三星/美光垄断。
先进制程 / 7nm / 5nm:芯片"线宽",越小越先进、越省电算力越高。英伟达 H100 用台积电 4nm,国产昇腾卡在中芯 7nm。
EUV / DUV 光刻机:造先进芯片的核心设备。EUV(极紫外,只有荷兰 ASML 能造)被禁运,是最硬的卡脖子;国产只能用上一代 DUV 靠"多重曝光"硬凑 7nm。
CoWoS / 先进封装:把 GPU 芯片和 HBM 拼装在一起的"高级封装"工艺。台积电垄断全球约九成,是"有钱也买不到 AI 芯片"的真实物理瓶颈。
CUDA / CANN / ROCm:芯片的"软件操作系统"。CUDA 是英伟达近 20 年的护城河,全球 400 万开发者绑定;CANN 是华为自研、ROCm 是 AMD/海光路线。硬件差距好补,软件生态差距最难补。
EDA:设计芯片用的软件工具,被 Synopsys/Cadence/Siemens 三家垄断 74%。一旦断供,先进芯片"画都画不出来"。
晶圆代工 / Foundry:芯片"代工厂"。设计公司(华为、寒武纪)只画图,把生产外包给代工厂(台积电、中芯国际)。这就是本报告"设计 vs 制造"的分工核心。
THE AI THESIS · 为什么是现在

02它在 AI 大主线里扮演什么角色

国产算力替代不是被市场竞争"打"出来的,而是被美国出口管制"逼"出来的。需求引擎有两个:(1) 高端 GPU 被锁,供给端断流;(2) 国家关基 + 大厂资本开支,需求端硬性国产化。两头一夹,国产替代从"可选"变"必须"。

2.1 出口管制时间线:所有逻辑的第一性驱动

时间事件对象对国产替代的含义
2022-10BIS 首次管制(按算力+互联双指标)A100 / H100 禁运起点。英伟达 A100/H100 计提约 4 亿美元
2023-03英伟达推"特供版"绕管制A800 / H800短暂喘息
2023-10改用 TPP 总性能指标,特供版也封A800 / H800 禁运逼出 H20 阉割版
2025-04H20 需许可(事实禁运)H20国产替代窗口打开;英伟达计提约 45 亿美元
2025-07H20 改逐案审批H20 部分解禁政策反复,强化"必须自主"信仰
2025-12-08放开 H200(+25% 附加费)H200 可售华;Blackwell 仍禁短期利空:高端训练卡部分回流分流需求
2026-01H200 改"合格客户推定批准"H200 准入制度化最先进 B 系列依旧买不到

来源:Tom's Hardware / GamersNexus / Introl / IFP / 英伟达财报,2022–2026。当前(2026-06)口径:H200 可出口(25% 附加费 + 推定批准),Blackwell(B 系列)仍全面禁运。

2.2 需求侧:大厂两万亿资本开支 + 国家强制国产化

~2000 亿
字节 2026 资本开支(上调 25%)
约一半买芯片 · 新浪, 2025-12
3800–4800 亿
阿里三年(2025–27)AI 基建
芯片采购七成投国产 · 雪球, 2026
900–1000 亿
腾讯 2026 资本开支
雪球, 2026
100%
国家关基项目 AI 芯片国产化率(政策要求)
央国企核心系统 2027 前完成 · 人民论坛, 2025-12
"为什么现在重要"一句话:英伟达数据中心对华营收已被压到接近零,而中国大厂两年 AI 资本开支合计已达"两万亿量级"——这笔钱无处可花,只能流向国产。这是国产替代最硬的需求逻辑,也是设计端公司营收一年暴增几十倍的根因。
VALUE CHAIN · 玩家分类

03玩家分类:谁负责设计、谁负责制造

这是你的问题 ①。一颗国产 AI 芯片从"图纸"到"算力中心",要经过设计 → 制造(代工)→ 封装 → 存储 → 设备/EDA/材料五个环节,分别由不同公司承担。关键认知:份额(出货量)在设计与整机端,但真正的利润和卡脖子在上游制造与 HBM。

设计端
(画图)
谁设计:华为昇腾、寒武纪、海光(DCU)、摩尔线程、沐曦、壁仞、燧原、天数智芯、景嘉微 + 大厂自研(阿里平头哥、百度昆仑芯)。只画图纸不建厂,定义芯片架构和软件栈。竞争点 = 算力 + 软件生态。护城河瓶颈:CUDA 生态
制造端
(代工)
谁制造:晶圆代工 = 中芯国际(先进制程唯一现实选择)、华虹(成熟制程);先进封装 = 通富微电、长电科技、盛合晶微;HBM 存储 = 长鑫存储(DRAM/HBM)、长江存储(NAND)。重资产、拼产能与良率。真瓶颈:先进制程产能 + HBM + CoWoS 封装
上游
设备/EDA
材料
谁供工具:设备 = 北方华创、中微、华海清科、拓荆、盛美、中科飞测;光刻机 = 上海微电子(最硬卡脖子);EDA = 华大九天、概伦电子;材料 = 沪硅产业、安集科技、雅克科技。最硬:EUV 光刻机(ASML 垄断,禁运)
下游
(用算力)
谁买单:互联网大厂(字节/阿里/腾讯/百度)、三大运营商智算中心、信创服务器厂商(浪潮信息/中科曙光/紫光股份)、国家"东数西算"枢纽。需求方 = 资本开支的源头。
记住这条主线(贯穿全报告):"做设计的拿份额、报表先暴涨;做制造的拿利润、卡脖子在它手里。" 昇腾、寒武纪一年营收暴增几十倍很吸睛,但它们能不能放量,取决于上游中芯的 7nm 产能、长鑫的 HBM 供给、长电/通富的先进封装良率——设计端的天花板是制造端给的

3.1 国产化率:哪个环节做得到,哪个还差得远

国产化率较高/已突破低/卡脖子
NAND 闪存(长江存储)
领先·232 层量产
刻蚀/CMP/清洗设备
~50%·强项突破
先进封装(CoWoS 类)
能做·良率爬坡
晶圆代工(中芯 7nm)
工艺能做·产能/良率不够
半导体设备整体国产化率
~13.6%(2024)
HBM 存储(长鑫)
落后 3–4 年·~13% 产能
EDA 工具(华大九天)
点状能做·全流程缺
光刻机(上海微电子)
DUV 刚交付·EUV 仅样机

国产化率/进度口径来自全球半导体观察、各公司公告、知乎深度,2025–2026。条形为定性示意,非精确百分比。

MARKET SIZE · 自下而上 TAM

04市场规模与渗透率

~1,425 亿
2024 中国 AI 芯片市场(元)
2029 约 1.34 万亿 · CAGR 53.7%
1,606 亿
2024 中国 AI 服务器市场(元,+134%)
中商产业研究院, 2026-03
~400 万张
2025 中国 AI 加速卡总出货
国产约 165 万 · IDC
~41%
2025 国产份额(首破四成)
2023 ~15% → 2024 ~30% → 2025 ~41%

4.1 渗透率 S 曲线:份额三年翻三倍

国产 AI 芯片在中国市场份额
2023
~15%
2024
~30%
2025
~41%
政策目标(关基项目)
100%(强制)

4.2 2025 中国 AI 加速卡份额拆分(IDC 口径)

厂商2025 出货量份额说明
英伟达~220 万张55%从四年前 95% 降至 55%(但数据中心口径已近零)
华为昇腾~81.2 万张20%国产第一、整体第二
阿里平头哥~25.6 万张6.6%自研推理芯片
百度昆仑芯~11.6 万张2.9%2025 出货 +350%,与寒武纪并列第三
AMD~16 万张4%第四
国产合计~165 万张41%首次突破四成
口径提醒:"市场规模金额"多来自中商产业研究院/券商,IDC 原文主要给"出货量与份额";窄口径(加速芯片)vs 宽口径(含服务器整机/数据中心)相差很大,2030 远期从 1.3 万亿(芯片)到 1.2 万亿(数据中心)不等。本报告以份额数据为主锚,金额取区间。
SUPPLY-DEMAND · 核心数据与差距

05核心数据:产量、算力,与海外差距多大

这是你的问题 ②。先立一把标尺:英伟达 H100 ≈ 990 TFLOPS(FP16 稠密)/ ~2,000 TFLOPS(FP8)+ 80GB HBM3。所有国产芯片都和它比。结论先行:单芯片差 1 代左右(昇腾约 H100 的 60–79%),但靠"堆系统"能在集群层面追平甚至反超;真正追不上的是软件生态、HBM 和先进制程产能。

5.1 算力对标:单芯片 vs 集群(注意精度口径)

芯片定位算力(标注精度)显存 / 带宽制程对标 & 差距
英伟达 H100标尺~990 TFLOPS FP16 / ~2000 FP880GB HBM3 / 3.35TB/s台积电 4nm—(基准)
英伟达 B200当代旗舰4,500 TFLOPS FP8 / 新增 FP4180–192GB / ~8TB/s台积电 4NP代际跃迁(仍禁运)
华为昇腾 910C国产龙头~800 TFLOPS FP16(整卡)128GB HBM3* / 3.2TB/s中芯 7nm 双 die单芯片 ≈ H100 60–79%;显存更大
寒武纪 思元590/690训推一体INT8 ~512 TOPS(590)7nm + Chiplet690 厂商称约 H100 80%(谨慎)
摩尔线程 MTT S5000全功能 GPU~1 PFLOPS FP880GB / 1.6TB/s"对标 H100"为 FP8 + 特定任务口径
壁仞 BR100 / 沐曦 C500GPGPUBR100 ~1 PFLOPS7nm实为 A100 档,非 H100

*910C 显存为华为官方标称 128GB HBM3;SemiAnalysis 等第三方因 HBM3 受管制,认为实为 96GB HBM2e 量级——本报告并列两说,倾向"官方乐观、第三方保守"之间。算力精度口径已并列标注(FP16/FP8 不可直接横比)。

"堆系统打单芯片"——华为的解法:CloudMatrix 384 超节点用 384 颗 910C 堆出 300 PFLOPS BF16,约为英伟达 GB200 NVL72 的 1.7–2 倍(GB200 NVL72 BF16 基准 SemiAnalysis 取 ~180 PFLOPS、另有 ~150 PFLOPS 口径,故倍数 1.7–2),HBM 总量 49.2TB(vs 13.8TB)。代价:功耗约为 GB200 NVL72 的 3.9 倍,每 FLOP 能效差约 2.3 倍——用"电费 + 组网"换"单芯片制程劣势"。在中国电价与"算力优先"的语境下,这笔账算得过来。

5.2 产量:能造多少

~60 万片
2026 计划产昇腾 910C(2025 的 2 倍)
系列总产能或达 160 万片 · 腾讯新闻, 2025
~30–40%
910C 良率(第三方估算,瓶颈)
瑞穗/中芯合作提升中
~18K 片/月
中芯 AI 专用晶圆产能(2027 仍)
SemiAnalysis:远不足大规模部署

5.3 三个差距:钱解决不了的瓶颈

COMPETITIVE LANDSCAPE & MOAT

06竞争格局与护城河:CUDA 才是那道墙

波特五力,逐条速读:

① 买方议价权 · 强:大厂+运营商集中采购、被政策推着多供应商,压价能力强。
② 供方议价权 · 极强:台积电 CoWoS、SK 海力士 HBM 卡全球脖子,国产被迫自建上游。
③ 新进入者 · 暴增:四小龙+大厂自研,2025 一年挤进 5 家上市,赛道极度拥挤。
④ 替代品威胁 · 中:英伟达 H200/B30 特供卡若大规模回流,分流高端需求。
⑤ 现有竞争 · 失衡:昇腾一家独大(份额 20%),其余在剩余份额里贴身肉搏。
份额迁移趋势:国产 AI 芯片在中国市场份额 2023 ~15% → 2024 ~30% → 2025 ~41%(详见 §04 S 曲线);英伟达从四年前 95% 一路退到 55%(数据中心口径对华更已近零)。这是一条政策强力推动、三年翻三倍的份额迁移曲线——也是整个主题的"势"。
✎ 为什么 CUDA 是真护城河

硬件可以堆量追平,软件生态差近十年——这决定"国产到底能替到几成"

维度英伟达 CUDA国产现状
生态积累2006 年起,约 20 年CANN 2021 / MindSpore 2018,落后近十年
模型覆盖23,000+ 模型昇腾 CANN ~160+ 主流模型
开发者~400 万迁移知识成本 >60%;90%+ 开源项目基于 CUDA
应对路线两条路:① CUDA 兼容(摩尔 MUSA / 沐曦 / 海光 ROCm)降迁移成本;② 自建生态(华为不兼容 CUDA,2025-08 全面开源 CANN,赌长期自主)

核心判断:硬件差距(约 1.5–2 倍,可靠堆量+先进封装弥补)远小于软件生态差距。CUDA 是真正护城河,也是"国产替代到底能替到几成"的最大变量——推理已可替,训练端的大规模调优仍被生态卡住。

6.1 护城河评级(per name)

华为昇腾 Narrow 自有生态+国资+规模 中芯国际 Narrow 先进制程稀缺性 寒武纪 None→Narrow 纯设计、生态弱 北方华创 Narrow 平台型设备 长鑫 HBM None 追赶中 英伟达 Wide CUDA 网络效应
U.S. & GLOBAL EQUITIES

07海外对标公司:标尺在哪、谁是真瓶颈

公司代码市值(USD)最新季营收(YoY)毛利率赛道占比*TTM PEFwd PEAI 链角色护城河
英伟达NVDA$5.08T$81.6B (+85%)75%数据中心 92%32.5x21.4xAI GPU 垄断 + CUDAWide
AMDAMD$827B$10.3B (+38%)55%数据中心 ~52%169x~58x唯一规模二供Narrow
台积电TSM$2.29T$35.9B (+40.6%)66.2%HPC 58%34.8x27.1x先进制程 + CoWoS 真瓶颈Wide
三星电子005930.KS$1.49T~43%HBM 占比小**27.5x~10x*代工 + HBM 双角色Narrow
SK 海力士000660.KS$1.12T₩97.15T (FY25 +47%)~62% 毛利HBM ~50%+23.3x~7x*HBM 全球龙头 ~59%Wide

市值/估值 as-of 2026-06;NVDA 为 Q1 FY27(2026-05 发布)。SK 海力士营收为 FY2025 全年 ₩97.15T(约 $68B)。*赛道占比=该公司营收中来自 AI/数据中心/HPC 的比重,看"含金量"(巨头不等于该赛道龙头)。**三星内存仅占整体约三成、HBM 更小,故下方对比图剔除三星说明原因。*带星 Forward PE 为存储深周期估算:峰值 EPS 上的低前瞻 PE,须警惕周期回落(见 §10 分歧 / §13 情景)。来源:CNBC / Capital.com / fullratio / SK Hynix FY25 PR / TrendForce 等,2026。

关键认知(颠覆直觉):真正的 AI 算力瓶颈不在 GPU 设计,在封装与 HBM。台积电 CoWoS 产能 2026 底约 12.7 万片/月(扩 80% 仍 sold out,英伟达独占一半+)、SK 海力士 HBM 市占 59% 且供不应求至 2028。所以——中芯对标台积电、长鑫对标 SK 海力士的难度,可能高于华为昇腾对标英伟达单芯片设计。国产替代真正的硬仗在制造端,不在设计端。
CHINA EQUITIES · 资本市场地图

08国产标的:谁在哪上市、估值多烫

这是你的问题 ④ 的上市地图部分。一句话格局:2025–2026 是国产算力 IPO 大潮——摩尔线程、沐曦登科创板,壁仞、天数智芯赴港股,燧原科创板过会。设计端"四小龙"几乎一年内集体上市,估值普遍透支。

8.1 A 股 / 港股重点标的

公司代码/上市地市值(RMB)2025 营收(YoY)盈利算力占比*TTM PEFwd PE 26e**护城河
寒武纪688256 · 科创板~8,000 亿元前三季 46.07 亿 (+2386%)净利 16 亿,扭亏~100%~430x~90xNone→Narrow
海光信息688041 · 科创板~6,500 亿元H1 54.64 亿 (+45%)净利 12 亿DCU ~40%~196x~85xNarrow
中芯国际688981 / 0981.HKA 股 ~1.0–1.25 万亿前三季 495 亿 (+18%)毛利 ~20%先进制程~15%~178x~45xNarrow
摩尔线程688795 · 科创板~3,000–4,000 亿元—(首日 +425%)亏损~100%亏损亏损·看 PSNone
沐曦股份688802 · 科创板~3,000 亿元在手订单 ~14.3 亿累亏 >30 亿~100%亏损亏损·看 PSNone
壁仞科技港股 2026-01 上市>1,300 亿港元三年半累亏 63 亿~100%亏损亏损·看 PSNone
天数智芯09903.HK—(超额 293 倍)H1 出货 15,700 片亏损~100%亏损亏损·看 PSNone
燧原科技科创板 2026-06 过会拟募 60 亿(未上市)前三季 5.4 亿亏损·腾讯占 50%+~100%亏损亏损·看 PSNone
北方华创002371 · 创业板~5,230 亿元前三季 273 亿 (+33%)净利 51 亿泛半导体设备~40x~30xNarrow
景嘉微300474 · 创业板7.2 亿 (+54%)净利 -1.65 亿图形为主亏损亏损·看 PSNone

市值/PE as-of 2026-06(寒武纪股本扩张后总市值约 8,000 亿+,TTM 动态 PE ~430x 仍处高位,2025-08 峰值曾达 ~514x)。*算力占比=营收中来自 AI 算力的比重(中芯先进制程占比低、北方华创为泛半导体设备,故"巨头≠纯算力标的")。**Fwd PE 26e 中带 ~ 为券商一致预期估算;多数设计端 2026 仍亏损,无意义的 PE 应改看 PS(寒武纪一度 111x PS、行业均 ~40x,远高于 NVDA 前瞻 PE 21x)。设备/封测部分公司精确市值为数据缺口。未上市但关键:华为昇腾、长江存储、长鑫存储(拟 2026 上市,目标估值 ~420 亿美元)。来源:同花顺/雪球/东方财富/各公司公告,2025–2026。

8.2 中美同图对比:营收差百倍,估值反而更贵

✎ 中美对比 · 5 张图看懂"revenue ≠ value"的反面

这个赛道最反直觉的地方:国产标的营收只有海外巨头的零头,PE 却高出几倍——市场给的是"政策 + 稀缺"溢价

🇨🇳 中国🌐 海外

① 市值(USD bn)

NVIDIA 🌐
$5,080
台积电 🌐
$2,290
SK 海力士 🌐
$1,120
AMD 🌐
$827
中芯国际 🇨🇳
~$174
寒武纪 🇨🇳
~$113
海光信息 🇨🇳
~$92

② 年化营收(USD bn)—— 差距最触目惊心

NVIDIA 🌐
~$326
台积电 🌐
~$144
SK 海力士 🌐
~$68
AMD 🌐
~$41
中芯国际 🇨🇳
~$9.2
海光信息 🇨🇳
~$1.3
寒武纪 🇨🇳
~$0.9

③ 年化净利润(USD bn,估算)—— 真正"赚到钱"的差距

NVIDIA 🌐
~$172
台积电 🌐
~$60
SK 海力士 🌐
~$30
AMD 🌐
~$5
中芯国际 🇨🇳
~$0.7
寒武纪 🇨🇳
~$0.3
海光信息 🇨🇳
~$0.3

注:营收/净利对比为单季×4 年化口径(NVDA 用 Q1 FY27、TSM/AMD 用最新季),与 FY 实际略有出入(TSM FY25 实际约 $122B 营收/$55B 净利、SK 海力士 FY25 净利约 $30B、AMD FY25 实际约 $35B 营收);设计端"四小龙"净利为,未入图。

④ 毛利率(%,统一毛利口径)

NVIDIA 🌐
75%
台积电 🌐
66%
SK 海力士 🌐
~62%
寒武纪 🇨🇳(估)
~60%
AMD 🌐
55%
中芯国际 🇨🇳
~22%

⑤ Forward PE(倍)—— 国产更贵

寒武纪 🇨🇳(2026e)
~90x
AMD 🌐
~58x
中芯国际 🇨🇳(估)
~45x
台积电 🌐
27x
NVIDIA 🌐
21x

SK 海力士/三星为存储深周期股,处 HBM 周期顶部、峰值 EPS 上前瞻 PE 极低(~7–10x),与高成长 AI 名估值不可同口径比,未入此图。

⑥ 估值溢价从何而来?

国产算力 PS(寒武纪一度 111x、海光 33x、行业均 ~40x)远高于美股巨头(英特尔 ~4x、英伟达前瞻 PE 仅 21x)。英伟达增速 85% 却只给 21x,寒武纪营收基数小 50 倍却给数百倍 PE。溢价 = ① 政策稀缺性(国家战略、真能量产的 AI GPU 屈指可数)+ ② 替代天花板想象(把"未来吃下英伟达让出的中国市场"提前贴现)+ ③ 科创板资金抱团、首日动辄 +600%。风险对照:这套溢价依赖①持续放量②良率产能跟上③政策不退坡,任一证伪即触发"一周蒸发 1,600 亿"式回调(寒武纪、摩尔、沐曦都发生过)。

COMPANY PROFILES · 公司名片

8.5逐家大白话名片:这些公司到底是谁

给完全没看过这些公司的读者一张张名片。💡 每张第一行=一句话记住它。分"设计端 / 制造端 / 上游设备"三组。

A · 设计端(画图的)

华为昇腾 未上市 Narrow

💡 国产算力唯一的"航母级"玩家,自己定芯片、自己建生态。
来头:华为海思自研,达芬奇架构 + CANN 软件栈。国产 AI 芯片绝对龙头,2025 出货 ~81 万颗、份额 20%。
客户 / AI 抓手:字节、阿里、运营商;H20 断供后最大受益者。CloudMatrix 384 超节点是它的杀手锏。
现状:910C 良率仍是瓶颈,不兼容 CUDA、赌自有生态,2025-08 全面开源 CANN。

寒武纪 688256 None→Narrow

💡 "国产 AI 芯片纯设计第一股",报表暴涨的代表。
来头:2016 成立、2020 科创板上市。思元(MLU)系列云端训推芯片。
客户 / AI 抓手:原大客户集中度高(一度 70%),2025 起客户分散;订单爆发带动营收一年增 24 倍。
现状:市值数千亿、动态 PE 上百倍,估值争议最大的标的之一。

海光信息 688041 Narrow

💡 "中国版 AMD",DCU 血缘来自 AMD 授权,软件迁移最省力。
来头:源自 AMD x86/GPU 授权,深算 DCU 走 ROCm 兼容路线。2025-06 换股吸收合并中科曙光。
客户 / AI 抓手:信创 + 智算,合并曙光后覆盖芯片→服务器→云全链条,合并后市值或超 4,000 亿。
现状:盈利能力在设计端里最好(H1 净利 12 亿),但 ROCm 授权血缘是长期变量。

摩尔线程 688795 None

💡 "国产 GPU 第一股",全功能 GPU(图形+计算+AI)。
来头:2020 成立,自研 MUSA 架构走 CUDA 兼容路线。2025-12 科创板上市,88 天过会创最快纪录。
客户 / AI 抓手:MTT S5000 原生 FP8,主打降迁移成本。
现状:上市首日 +425%、市值冲 4,000 亿后回调 ~40%;仍亏损。

沐曦股份 688802 None

💡 "史上最赚钱新股",首日涨近 7 倍。
来头:曦云 GPGPU 系列(对标 A100 档),MXMACA 软件栈走 CUDA 兼容。2025-12 科创板上市。
客户 / AI 抓手:在手订单 ~14.3 亿;新一代 C600 2025 底进风险量产。
现状:累计亏损 >30 亿、13 个季度未盈利,最早 2026 才可能盈亏平衡。

壁仞 / 燧原 / 天数智芯 None

💡 "GPU 四小龙"剩下三家,团队多来自英伟达/AMD。
壁仞:BR100 对标 A100,2026-01 港股上市,三年半累亏 63 亿。
燧原:腾讯系(腾讯占营收 50%+),2026-06 科创板过会,拟募 60 亿。
天数智芯:天垓(训练)/智铠(推理),2026-01 港股上市超额认购 293 倍,累计出货 5 万+片。

B · 制造端(代工/封装/存储)

中芯国际 688981 / 0981.HK Narrow

💡 国产先进制程唯一现实选择,昇腾的"代工厂"。
来头:国产晶圆代工绝对龙头,A+H 两地上市,A 股市值破万亿。
AI 抓手:N+1/N+2 等效 7nm 代工华为昇腾 910B/C,靠 DUV 多重曝光(无 EUV)。
现状:8 寸月产能破 100 万片、利用率 95.8%;但 AI 专用产能 2027 仍仅 ~18K 片/月——产能是真瓶颈。

长鑫存储 CXMT 未上市 None

💡 国产 HBM 的全部希望,对标 SK 海力士。
来头:国产 DRAM 主力,DDR5 良率破 80%。HBM 是 AI 芯片第二硬卡脖子。
AI 抓手:已向华为交付 HBM3 样品(MR-MUF 封装),计划 2026 量产、2027 HBM3E。
现状:落后海外 3–4 年(对方已 HBM4),拟 2026 上市、目标估值 ~420 亿美元。

通富微电 / 长电科技 002156 / 600584 Narrow

💡 国产"先进封装"主力,替代台积电 CoWoS 的曲线救国。
通富微电:2.5D 已通过昇腾 910B 验证,也为 AMD MI 系列封装;2025 前三季营收 201 亿。
长电科技:封测行业第一,2025 前三季营收 287 亿;XDFOI 类 CoWoS 方案。
现状:2026 被称"国产 CoWoS 元年",月产能向 2,000–2,500 片爬坡,良率仍在追。

长江存储 YMTC 未上市 Narrow

💡 国产存储里最接近"不卡脖子"的一环。
来头:NAND 闪存龙头,自研 Xtacking 架构,2022 全球首发 232 层。
AI 抓手:已实现 ~270 层 3D TLC 商业化,目标 2026 底冲全球 NAND 供应 15%。
现状:被列实体清单,挑战在全国产化产线设备/材料,而非堆叠技术本身。

C · 上游设备 / EDA / 光刻机

北方华创 002371 Narrow

💡 国产半导体设备"平台型一哥",A 股半导体盈利王。
来头:刻蚀/薄膜/炉管/清洗全覆盖,2025 前三季营收 273 亿、净利 51 亿。
AI 抓手:国产替代 + AI 扩产双驱动,市值 ~5,230 亿。
现状:盈利稳健、估值相对理性,是设备端最确定的标的之一。

中微 / 华海清科 / 拓荆 / 盛美 Narrow

💡 各守一个细分设备环节,强项已突破。
中微 (688012):刻蚀机,已进 5nm 验证,设备国产化率 >95%。
华海清科 (688120):CMP 抛光绝对龙头,国内份额 ~40%。
拓荆/盛美:薄膜沉积 / 清洗设备,营收高增。

上海微电子 SMEE 借壳中 None

💡 最硬卡脖子的那一环——国产光刻机。
来头:国产光刻机唯一玩家。2025-05 交付首台 28nm 浸没式 DUV,国产化率 >90%。
AI 抓手:支撑 7nm 多重曝光;EUV 仅样机、规划 2026 小批量。
现状:DUV 产能 ~10 片/h vs ASML ~170 片/h,约 8 年代差;EUV 与 ASML 是代际级差距。

华大九天 301269 None→Narrow

💡 国产 EDA"最接近全流程",但先进制程仍缺。
来头:国产 EDA 龙头,对抗 Synopsys/Cadence/Siemens 三巨头(占全球 74%)。
AI 抓手:2025-06 美国一度要求三巨头停供,直接催化国产替代。
现状:研发吞噬利润(2025 净利暴跌),并购整合是当前主路径。
ORDERS & BUSINESS REALITY

09订单怎么体现、目前有什么问题

这是你的问题 ③。订单从三个地方"露头":① 上市公司报表(营收/合同负债/存货);② 运营商与政府智算中心集采招标;③ 大厂资本开支转向国产。但有订单 ≠ 交得出货——产能和良率是最大现实问题。

9.1 订单如何体现

渠道具体体现数据
设计端报表暴增寒武纪营收/存货/合同负债2025 前三季营收 +2386%;存货 37 亿(备货扩张)
运营商集采中国移动 2025–26 AI 推理服务器集采 7,058 台2,058 套类 CUDA + 5,000 套 CANN(昇腾)
政府最大单笔集采百度昆仑芯中标移动集采三标包拿 70% / 70% / 100%,十亿级
大厂采购转向字节/阿里/美团首次大规模采购国产单超节点成本约 2 亿元
大厂自研放量阿里平头哥 / 百度昆仑芯出货平头哥 2026-02 累计交付 47 万颗;昆仑芯 2025 +350%
昇腾产业链订单盛合晶微 CoWoS 产能专供昇腾目标 2026 月产数万片

9.2 目前存在的五大问题

① 产能不足,有订单交不了货

中芯 AI 专用产能 2027 仍 ~18K 片/月;国产 HBM 2026 中国需求缺口约 300–400 万堆;CoWoS 月产能仅数千片。"卖得出、造不够"是最大现实矛盾。

② 软件生态不成熟

CUDA 迁移成本 >60%,90%+ 开源 AI 项目基于 CUDA。国产卡"能买、不好用",训练端调优痛点突出。

③ 良率低 → 成本高

910C 良率 ~30–40%;国产 HBM3 出厂价较国际高 30–50%。良率直接吃掉国产替代的性价比优势。

④ 估值泡沫 + 利用率存疑

寒武纪动态 PE 一度 514x;更扎心的是 2025 上半年全国智算中心利用率仅 ~32%,部分国产集群闲置率高达 80%——"建了不一定用得起来"。

⑤ 政策/补贴依赖:国产替代订单高度依赖运营商集采、政府智算中心招标和信创政策回款。海光自己提示"随信创回暖、政府回款加速,销售有望回暖"——反过来说,政策节奏与回款就是这个赛道的命门。一旦财政或政策退坡,需求的"硬度"会打折。
✎ 直接回答:"需求这么强,怎么还有应收账款/闲置风险?"

需求强 ≠ 现金回得快,也 ≠ 算力用得起来

应收账款=货已发、收入已确认、钱还没到(账期问题)。增长越快应收越大,真风险在回款时点和单一客户集中(如燧原靠腾讯 50%+)。闲置率高=智算中心一窝蜂建、但算法架构/供应链/运维跟不上,导致"建好没满负荷跑"。这两个都不是"需求假",而是"需求真、但兑现链条有摩擦"——这正是把"国产替代"从主题做成现金流时最容易栽的地方。

KEY DEBATES · VARIANT VIEW

10市场最大的分歧点 + 我方观点

分歧 1 · 国产替代是真需求,还是政策补贴吹的泡沫?

市场共识

泡沫论:2025H1 智算中心利用率仅 32%、部分集群闲置 80%,建完即退场。

我方观点

需求总量真实(大厂两万亿、阿里芯片七成投国产是硬订单),但结构性错配——不是没需求,是供需/运维没对齐。不是泡沫,是早期摩擦。

判据 / 证伪

看 2026–27 智算中心利用率能否从 32% 回升到 60%+。若持续低于 40%,泡沫论成立。
分歧 2 · 昇腾能不能真正替代 H100?

市场共识

"昇腾对标 H100"——媒体常态化表述。

我方观点

分场景:推理已可替代(910C 反超 H20);训练端单卡性能/显存带宽仍逊,且 CUDA 95% 兼容意味着最难的 5%(大规模训练调优)仍卡脖子。"系统级替代"成立,"单芯片替代"被夸大。

判据 / 证伪

看头部大模型公司是否用纯昇腾集群完成千亿级模型预训练(非微调/推理)。做到了,替代论坐实。
分歧 3 · 制程锁死 7nm 后,算力天花板在哪?

市场共识

EUV 禁运,中芯困于 7nm,单芯片密度受限 = 天花板已现。

我方观点

华为押"τ 定律"——不靠先进光刻,用系统级/多 die 堆叠换密度。短期能用"堆量+组网"绕过,但能效比(电费、机房、散热)是隐性天花板,且最先进训练拼的是能效。

判据 / 证伪

看 CloudMatrix 类超节点的每 FLOP 能效能否从 GB200 的 1/2.3 追到 0.8 以上。
分歧 4 · H200 放开,是否冲垮国产替代逻辑?

市场共识

利空:H200 带 25% 附加费回流,高端训练需求被分流。

我方观点

影响有限且强化自主信仰:政策可逆性已被反复证明(H20 禁→解→H200),大厂不敢押单一供给;且 Blackwell 仍禁,最先进卡依旧买不到。短期分流、长期加固国产。

判据 / 证伪

看大厂 2026 国产采购比例是否因 H200 回落。阿里"七成投国产"若下修,利空成立。
分歧 5 · 设计端 vs 制造端,钱该押哪头?

市场共识

追设计端"四小龙"——弹性大、故事性强、首日翻几倍。

我方观点

真瓶颈和真利润在制造端(中芯产能、长鑫 HBM、先进封装、设备)。设计端营收暴增但普遍亏损、估值透支;制造/设备端(北方华创)盈利实、估值相对理性。"做设计拿份额,做制造拿利润。"

判据 / 证伪

看 2026 设计端能否在放量同时实现正现金流。做不到,则制造端的"卖铲人"逻辑更稳。
DEEP DIVE · CHINA vs ASML/TSMC/SK

11卡脖子深拆:差距到底是"做不出"还是"高端做不好"

✎ 直接回答

一句话定性:六大环节里只有两个是"代际级、近完全做不出"

光刻机(EUV)和 HBM 是仅有的两个代际级卡脖子点(代差 3–8 年);其余环节(代工、封装、设备、标准存储、EDA、材料)多是"能做、但高端良率/产能/份额不够"——属"渐进追赶"而非"完全做不出"。所以"国产替代"在中低端已成立,真正的硬墙是 EUV 和 HBM 这两块。

环节代表玩家卡脖子性质量化代差
光刻机 EUV上海微电子 SMEE最硬·近"完全做不出"DUV 刚交付(28nm)·产能 10 vs ASML 170 片/h·约 8 年;EUV 仅样机
HBM长鑫 CXMT第二硬·量产代际落后HBM3 2026 量产·落后 SK 海力士 3–4 年(对方已 HBM4)
晶圆代工(先进)中芯国际能做但产能/良率不够等效 7nm 量产·无 EUV·良率约台积电 70%·AI 产能严重不足
先进封装通富/长电能做·良率爬坡2.5D 已量产验证·CoWoS 类良率仍有缺口
DRAM/NAND(标准)长鑫/长江存储基本做得出·追高端NAND 232 层已量产领先·DDR5 良率破 80%
设备(刻蚀/CMP/清洗)北方华创/中微多数能做·强项突破刻蚀/CMP/清洗国产化率破双位数~50%·量检测/光刻仍弱
EDA华大九天点状能做·全流程缺三巨头占 74%·国产无先进制程全流程·断供风险高
材料沪硅/安集/雅克中低端能做·高端依赖进口大硅片/抛光液局部突破·前驱体国产化率 ~40%

11.1 最硬的两块,再拆细一层

光刻机:为什么 8 年代差是"代际级"

  • ASML EUV 禁运直接锁死中芯 5nm 以下,这是所有先进制程的总开关
  • SMEE 2025-05 交付首台 28nm 浸没式 DUV(等效 134nm,可支撑 7nm 多重曝光),但产能 ~10 片/h vs ASML ~170 片/h。
  • 核心短板在光源:中科院全固态 DUV 光源 70mW/6kHz vs ASML 100–120W/8–9kHz,差数量级。
  • EUV 仅样机阶段,规划 2026 小批量——与 ASML 已进 High-NA 量产是代际差距。

HBM:为什么代差是"台阶式拉大"

  • 长鑫 HBM3 已交样(MR-MUF 封装,源自 SK 海力士路线),计划 2026 量产、2027 HBM3E。
  • 但海外 HBM4 已在 2025–26 量产——长鑫量 HBM3 时对方已量 HBM4,差一代到一代半。
  • HBM3→HBM4 带宽提升约 3 倍、整体性能比 HBM3E 高 ~60%,代际不是线性而是台阶
  • 国产 HBM 产能仅约全球需求 13%,良率低导致价格高 30–50%。

11.2 路线图:芯片走哪条路、绕开哪个卡点

设计 · 中国
华为/寒武纪画图纸(绕不开 EDA:华大九天补点、三巨头仍主导)
代工 · 中国
中芯7nm DUV 多重曝光(绕开 EUV,代价是良率/产能/成本)
存储 · 中国
长鑫国产 HBM3(最大短板,2026 才量产)
封装 · 中国
长电/通富类 CoWoS(绕开台积电封装产能限制)
系统 · 中国
CloudMatrix超节点堆量(用组网绕开单芯片制程劣势)

这条"曲线救国"路线的逻辑:每一个被卡的点(EUV、HBM、CoWoS、单芯片制程),都用"次优方案 + 系统级堆叠"绕过去——可行,但每一步都付出良率/能效/成本的代价。

WINNERS & LOSERS

12谁受益、谁受害

这是你的问题 ④ 的后半部分。国产替代是一场价值再分配:英伟达让出的中国市场,流向国产设计 + 制造 + 信创整机;但短期内中国云厂商承担"性价比下降"的代价。

▲ 受益方

国产 GPU 设计商份额昇腾、寒武纪、摩尔、沐曦、壁仞、燧原、昆仑芯、平头哥——2025 国产交付 165 万颗、占中国市场 41%。
中芯国际利润+稀缺国产先进制程唯一现实选择,市值破万亿,AI 代工排队。
设备 / HBM 上游最确定北方华创、中微、华海清科、长鑫、长江存储——"卖铲人",扩产即受益、盈利实。
先进封装CoWoS 元年长电、通富——替代台积电封装产能。
信创服务器整机下游集成浪潮信息、中科曙光、紫光股份——承接智算中心集采。

▼ 受害方

英伟达 NVDA失中国市场数据中心对华营收已近零;H20 计提 45 亿美元;中国占总营收 26%(2022) → 17%(FY24) → 13%(FY25) → ~0(数据中心)。但全球 AI 需求太强,整体仍创纪录——"失之中国,收之全球"
依赖英伟达的中国云厂商短期阵痛字节/阿里/腾讯被迫用生态更弱、性价比更低的国产替代,迁移成本高、单超节点约 2 亿元。
台积电 TSM影响有限中国客户流失,但仍是全球 CoWoS/先进制程核心,市值 2.29 万亿美元、订单 sold out——几乎无感
✎ 直接回答:"英伟达丢了中国,为什么股价还创新高?"

因为全球 AI 需求的增量,远大于中国市场的损失

英伟达数据中心营收单季 $75B(+92%),中国数据中心贡献已被压到约零——但它整体营收仍创纪录、毛利率回到 75%(不再有 H20 库存计提)。换句话说,中国市场对英伟达从"重要"变成"放弃也无所谓"。这对国产替代是双刃剑:好处是国产在中国市场没有英伟达正面竞争(被管制挡在门外);坏处是国产卡只能内循环,难以走向全球与英伟达硬碰硬。

BULL / BASE / BEAR

13三情景与证伪条件

▲ 牛市

概率 ~25%

中芯产能/良率快速爬坡,长鑫 HBM3 2026 顺利量产,CUDA 迁移工具成熟。国产份额 2027 突破 60%,设计端实现正现金流,估值从"故事"切到"业绩"。

触发:智算利用率回 60%+、纯昇腾集群完成千亿级预训练。

● 基准

概率 ~55%

国产在推理大规模替代、训练仍部分依赖进口;份额稳步升至 50%+ 但被产能/HBM/良率持续拖累。设计端分化(龙头活、尾部出清),制造/设备端稳健兑现。估值高位震荡、挤泡沫。

最可能路径:主题真实、兑现慢、波动大。

▼ 熊市

概率 ~20%

HBM/光刻持续卡死,良率上不去;H200/B30 大规模回流分流需求;财政退坡、智算闲置率高企暴露。设计端高估值标的"一周蒸发千亿"式回调,主题降温为"政策概念"。

触发:阿里国产采购比例下修、利用率持续 <40%、又一轮 IPO 破发。

CATALYST CALENDAR

14催化剂日历(未来 12–24 个月)

2026 Q1关键
华为昇腾 950PR 发布(推理 Prefill/推荐),全年出货目标 75 万颗
2026 初利好
长鑫 HBM3 量产(良率 >80%)——国产 HBM 关键节点
2026 H1关键
"国产 CoWoS 元年":长电/通富月产能向 2,000–2,500 片爬坡
2026 Q2–Q3利好
昇腾 910D 大规模量产(5nm/4Die/FP8,~1000T,传闻待证)
2026 全年关键
字节 ~2000 亿、阿里三年 3800–4800 亿资本开支落地 → 大厂招标节奏
2026关键
长鑫存储拟上市(目标估值 ~420 亿美元);燧原科创板挂牌
2026 Q4利好
华为昇腾 950DT 发布(推理 Decode + 训练)
持续利空
美国管制更新:H200 附加费 / Blackwell 是否松动 / Entity List 扩容
2027关键
央国企核心系统须完成全面国产化替代(政策硬约束);长鑫 HBM3E
RISKS & BOTTOM LINE

15风险矩阵与结论

15.1 风险矩阵

类别风险概率影响
技术EUV/HBM 持续卡死,先进制程无法突破
供给产能/良率上不去,有订单交不了货
需求智算中心闲置率高、利用率不及预期中高
政策H200/B30 大规模回流分流;财政补贴退坡
估值设计端上百倍 PE,业绩证伪即剧烈回调

一句话定调

国产算力替代是国家战略级、确定性最高的"方向",但兑现路径最颠簸的"赛道"。需求被管制逼成刚需、份额三年翻三倍——但真瓶颈(EUV 光刻、HBM)3–8 年无解,设计端营收基数极小却给上百倍估值,最该看的反而是利润和卡脖子都在手里的制造/设备/HBM 上游,而非首日翻几倍的设计端"四小龙"。主题做多、个股挑剔。Setup 3/5

免责与数据口径:本报告为内部研究参考,非投资建议。主用口径:份额/出货量以 IDC 为准,市场规模金额以中商产业研究院/券商为准(两者勿混),海外财务以最新季报为准(NVDA 为 Q1 FY27),股价/市值 as-of 2026-06。已知数据缺口:部分设备/封测公司精确市值、燧原/沐曦精确算力规格、长鑫/长江存储产能(未上市不披露)、910C/910D 部分规格为第三方传闻。算力数字注意精度口径(FP16/FP8 不可直接横比)。护城河评级与情景概率为本报告判断。媒体常态化的"X 进入英伟达供应链""全面对标 H100"已做谨慎核实/修正——本报告未见任何国产设计公司进入英伟达供应链,方向恰相反(英伟达让出中国份额给国产)。