TL;DR · 一页纸结论
0030 秒读懂国产算力替代
是什么:在美国出口管制下,用国产 AI 加速芯片(华为昇腾、寒武纪等)+ 国产代工/封装/存储/设备,替代英伟达 GPU 撑起中国算力中心。多大:2025 年国产 AI 芯片在中国市场份额首次达 ~41%,对应 AI 芯片 TAM 约 1,425 亿元(2024)→ 2029 约 1.34 万亿。谁赢:短期是设计端"四小龙"+ 昇腾拿份额,但真利润与真瓶颈在制造端(中芯、长鑫 HBM、先进封装、光刻机)。我的观点:主题真实但被严重透支——设计端公司营收基数极小却给上百倍 PE,最硬的卡脖子(EUV 光刻、HBM)3–8 年内无解。
~41%
2025 国产 AI 芯片份额(首破四成)
IDC, 2026-04
6.2/10
行业吸引力评分
政策×成长满分,盈利/资本密度拖累
华为昇腾
最该看的"标的"(未上市,看产业链)
2025 出货 ~81 万颗,国产第一
3/5
Setup score(该不该追)
主题强、估值烫、执行风险大
✎ 行业吸引力评分 · 7 维加权
composite 6.2/10:政策与成长拉满,盈利能力与资本密度是短板
越高越好分值
一句话驱动:这是一个国家战略级、政策给满分、成长曲线极陡的赛道,但设计端普遍亏损、制造端极重资产、需求高度依赖少数大厂与运营商集采——所以"行业很重要"≠"现在买就对"。
DEFINITION & BOUNDARY
01定义边界:本报告说的"算力替代"指什么
IN(在范围内):用于 AI 训练/推理的大算力加速芯片(GPU/GPGPU/NPU/ASIC)及其完整国产供应链——芯片设计 → 晶圆代工 → 先进封装 → HBM 存储 → 半导体设备 / EDA / 材料。对标海外为 NVIDIA、AMD(设计)+ 台积电、三星(制造)+ SK 海力士(HBM)。
OUT(不在范围内):手机 SoC、消费电子芯片、车规 MCU、模拟/功率器件、通用 CPU 信创(仅在与算力直接相关处提及,如海光 x86)。这条边界是防"什么都往里塞、把 TAM 吹大"的第一道防线——本报告只谈"撑起智算中心的那块算力芯片及其上游"。
✎ 基础概念速查
先把全篇反复出现的名词一次讲清(读者很聪明,但不必是芯片专家)
GPU / GPGPU / NPU:都是 AI"算力芯片"。GPU 原本画图、被拿来算 AI;GPGPU 是通用化的 GPU(英伟达、摩尔、沐曦);NPU 是专为 AI 设计的芯片(华为昇腾、寒武纪走这条)。
TFLOPS / PFLOPS:每秒浮点运算次数,衡量"算力大小"。1 PFLOPS = 1000 TFLOPS。比较时必须看精度(见下),否则数字会骗人。
FP16 / BF16 / FP8 / FP4:算力的"精度档位"。位数越低、同一颗芯片标称算力越大。厂商爱用低精度报大数——A 家说 FP8 1 PFLOPS、B 家说 FP16 800 TFLOPS,不能直接比。
HBM(高带宽存储):堆叠在 GPU 旁边的"超高速内存",决定大模型喂数据的速度。是 AI 芯片第二硬的卡脖子点,全球被 SK 海力士/三星/美光垄断。
先进制程 / 7nm / 5nm:芯片"线宽",越小越先进、越省电算力越高。英伟达 H100 用台积电 4nm,国产昇腾卡在中芯 7nm。
EUV / DUV 光刻机:造先进芯片的核心设备。EUV(极紫外,只有荷兰 ASML 能造)被禁运,是最硬的卡脖子;国产只能用上一代 DUV 靠"多重曝光"硬凑 7nm。
CoWoS / 先进封装:把 GPU 芯片和 HBM 拼装在一起的"高级封装"工艺。台积电垄断全球约九成,是"有钱也买不到 AI 芯片"的真实物理瓶颈。
CUDA / CANN / ROCm:芯片的"软件操作系统"。CUDA 是英伟达近 20 年的护城河,全球 400 万开发者绑定;CANN 是华为自研、ROCm 是 AMD/海光路线。硬件差距好补,软件生态差距最难补。
EDA:设计芯片用的软件工具,被 Synopsys/Cadence/Siemens 三家垄断 74%。一旦断供,先进芯片"画都画不出来"。
晶圆代工 / Foundry:芯片"代工厂"。设计公司(华为、寒武纪)只画图,把生产外包给代工厂(台积电、中芯国际)。这就是本报告"设计 vs 制造"的分工核心。
THE AI THESIS · 为什么是现在
02它在 AI 大主线里扮演什么角色
国产算力替代不是被市场竞争"打"出来的,而是被美国出口管制"逼"出来的。需求引擎有两个:(1) 高端 GPU 被锁,供给端断流;(2) 国家关基 + 大厂资本开支,需求端硬性国产化。两头一夹,国产替代从"可选"变"必须"。
2.1 出口管制时间线:所有逻辑的第一性驱动
| 时间 | 事件 | 对象 | 对国产替代的含义 |
| 2022-10 | BIS 首次管制(按算力+互联双指标) | A100 / H100 禁运 | 起点。英伟达 A100/H100 计提约 4 亿美元 |
| 2023-03 | 英伟达推"特供版"绕管制 | A800 / H800 | 短暂喘息 |
| 2023-10 | 改用 TPP 总性能指标,特供版也封 | A800 / H800 禁运 | 逼出 H20 阉割版 |
| 2025-04 | H20 需许可(事实禁运) | H20 | 国产替代窗口打开;英伟达计提约 45 亿美元 |
| 2025-07 | H20 改逐案审批 | H20 部分解禁 | 政策反复,强化"必须自主"信仰 |
| 2025-12-08 | 放开 H200(+25% 附加费) | H200 可售华;Blackwell 仍禁 | 短期利空:高端训练卡部分回流分流需求 |
| 2026-01 | H200 改"合格客户推定批准" | H200 准入制度化 | 最先进 B 系列依旧买不到 |
来源:Tom's Hardware / GamersNexus / Introl / IFP / 英伟达财报,2022–2026。当前(2026-06)口径:H200 可出口(25% 附加费 + 推定批准),Blackwell(B 系列)仍全面禁运。
2.2 需求侧:大厂两万亿资本开支 + 国家强制国产化
~2000 亿
字节 2026 资本开支(上调 25%)
约一半买芯片 · 新浪, 2025-12
3800–4800 亿
阿里三年(2025–27)AI 基建
芯片采购七成投国产 · 雪球, 2026
900–1000 亿
腾讯 2026 资本开支
雪球, 2026
100%
国家关基项目 AI 芯片国产化率(政策要求)
央国企核心系统 2027 前完成 · 人民论坛, 2025-12
"为什么现在重要"一句话:英伟达数据中心对华营收已被压到接近零,而中国大厂两年 AI 资本开支合计已达"两万亿量级"——这笔钱无处可花,只能流向国产。这是国产替代最硬的需求逻辑,也是设计端公司营收一年暴增几十倍的根因。
VALUE CHAIN · 玩家分类
03玩家分类:谁负责设计、谁负责制造
这是你的问题 ①。一颗国产 AI 芯片从"图纸"到"算力中心",要经过设计 → 制造(代工)→ 封装 → 存储 → 设备/EDA/材料五个环节,分别由不同公司承担。关键认知:份额(出货量)在设计与整机端,但真正的利润和卡脖子在上游制造与 HBM。
设计端
(画图)
谁设计:华为昇腾、寒武纪、海光(DCU)、摩尔线程、沐曦、壁仞、燧原、天数智芯、景嘉微 + 大厂自研(阿里平头哥、百度昆仑芯)。只画图纸不建厂,定义芯片架构和软件栈。竞争点 = 算力 + 软件生态。护城河瓶颈:CUDA 生态
制造端
(代工)
谁制造:晶圆代工 = 中芯国际(先进制程唯一现实选择)、华虹(成熟制程);先进封装 = 通富微电、长电科技、盛合晶微;HBM 存储 = 长鑫存储(DRAM/HBM)、长江存储(NAND)。重资产、拼产能与良率。真瓶颈:先进制程产能 + HBM + CoWoS 封装
上游
设备/EDA
材料
谁供工具:设备 = 北方华创、中微、华海清科、拓荆、盛美、中科飞测;光刻机 = 上海微电子(最硬卡脖子);EDA = 华大九天、概伦电子;材料 = 沪硅产业、安集科技、雅克科技。最硬:EUV 光刻机(ASML 垄断,禁运)
下游
(用算力)
谁买单:互联网大厂(字节/阿里/腾讯/百度)、三大运营商智算中心、信创服务器厂商(浪潮信息/中科曙光/紫光股份)、国家"东数西算"枢纽。需求方 = 资本开支的源头。
记住这条主线(贯穿全报告):"做设计的拿份额、报表先暴涨;做制造的拿利润、卡脖子在它手里。" 昇腾、寒武纪一年营收暴增几十倍很吸睛,但它们能不能放量,取决于上游中芯的 7nm 产能、长鑫的 HBM 供给、长电/通富的先进封装良率——设计端的天花板是制造端给的。
3.1 国产化率:哪个环节做得到,哪个还差得远
国产化率较高/已突破低/卡脖子
国产化率/进度口径来自全球半导体观察、各公司公告、知乎深度,2025–2026。条形为定性示意,非精确百分比。
MARKET SIZE · 自下而上 TAM
04市场规模与渗透率
~1,425 亿
2024 中国 AI 芯片市场(元)
2029 约 1.34 万亿 · CAGR 53.7%
1,606 亿
2024 中国 AI 服务器市场(元,+134%)
中商产业研究院, 2026-03
~400 万张
2025 中国 AI 加速卡总出货
国产约 165 万 · IDC
~41%
2025 国产份额(首破四成)
2023 ~15% → 2024 ~30% → 2025 ~41%
4.1 渗透率 S 曲线:份额三年翻三倍
国产 AI 芯片在中国市场份额
4.2 2025 中国 AI 加速卡份额拆分(IDC 口径)
| 厂商 | 2025 出货量 | 份额 | 说明 |
| 英伟达 | ~220 万张 | 55% | 从四年前 95% 降至 55%(但数据中心口径已近零) |
| 华为昇腾 | ~81.2 万张 | 20% | 国产第一、整体第二 |
| 阿里平头哥 | ~25.6 万张 | 6.6% | 自研推理芯片 |
| 百度昆仑芯 | ~11.6 万张 | 2.9% | 2025 出货 +350%,与寒武纪并列第三 |
| AMD | ~16 万张 | 4% | 第四 |
| 国产合计 | ~165 万张 | 41% | 首次突破四成 |
口径提醒:"市场规模金额"多来自中商产业研究院/券商,IDC 原文主要给"出货量与份额";窄口径(加速芯片)vs 宽口径(含服务器整机/数据中心)相差很大,2030 远期从 1.3 万亿(芯片)到 1.2 万亿(数据中心)不等。本报告以份额数据为主锚,金额取区间。
SUPPLY-DEMAND · 核心数据与差距
05核心数据:产量、算力,与海外差距多大
这是你的问题 ②。先立一把标尺:英伟达 H100 ≈ 990 TFLOPS(FP16 稠密)/ ~2,000 TFLOPS(FP8)+ 80GB HBM3。所有国产芯片都和它比。结论先行:单芯片差 1 代左右(昇腾约 H100 的 60–79%),但靠"堆系统"能在集群层面追平甚至反超;真正追不上的是软件生态、HBM 和先进制程产能。
5.1 算力对标:单芯片 vs 集群(注意精度口径)
| 芯片 | 定位 | 算力(标注精度) | 显存 / 带宽 | 制程 | 对标 & 差距 |
| 英伟达 H100 | 标尺 | ~990 TFLOPS FP16 / ~2000 FP8 | 80GB HBM3 / 3.35TB/s | 台积电 4nm | —(基准) |
| 英伟达 B200 | 当代旗舰 | 4,500 TFLOPS FP8 / 新增 FP4 | 180–192GB / ~8TB/s | 台积电 4NP | 代际跃迁(仍禁运) |
| 华为昇腾 910C | 国产龙头 | ~800 TFLOPS FP16(整卡) | 128GB HBM3* / 3.2TB/s | 中芯 7nm 双 die | 单芯片 ≈ H100 60–79%;显存更大 |
| 寒武纪 思元590/690 | 训推一体 | INT8 ~512 TOPS(590) | — | 7nm + Chiplet | 690 厂商称约 H100 80%(谨慎) |
| 摩尔线程 MTT S5000 | 全功能 GPU | ~1 PFLOPS FP8 | 80GB / 1.6TB/s | — | "对标 H100"为 FP8 + 特定任务口径 |
| 壁仞 BR100 / 沐曦 C500 | GPGPU | BR100 ~1 PFLOPS | — | 7nm | 实为 A100 档,非 H100 |
*910C 显存为华为官方标称 128GB HBM3;SemiAnalysis 等第三方因 HBM3 受管制,认为实为 96GB HBM2e 量级——本报告并列两说,倾向"官方乐观、第三方保守"之间。算力精度口径已并列标注(FP16/FP8 不可直接横比)。
"堆系统打单芯片"——华为的解法:CloudMatrix 384 超节点用 384 颗 910C 堆出 300 PFLOPS BF16,约为英伟达 GB200 NVL72 的 1.7–2 倍(GB200 NVL72 BF16 基准 SemiAnalysis 取 ~180 PFLOPS、另有 ~150 PFLOPS 口径,故倍数 1.7–2),HBM 总量 49.2TB(vs 13.8TB)。代价:功耗约为 GB200 NVL72 的 3.9 倍,每 FLOP 能效差约 2.3 倍——用"电费 + 组网"换"单芯片制程劣势"。在中国电价与"算力优先"的语境下,这笔账算得过来。
5.2 产量:能造多少
~60 万片
2026 计划产昇腾 910C(2025 的 2 倍)
系列总产能或达 160 万片 · 腾讯新闻, 2025
~30–40%
910C 良率(第三方估算,瓶颈)
瑞穗/中芯合作提升中
~18K 片/月
中芯 AI 专用晶圆产能(2027 仍)
SemiAnalysis:远不足大规模部署
5.3 三个差距:钱解决不了的瓶颈
- 软件生态(最难):英伟达 CUDA 近 20 年、23,000+ 模型、400 万开发者;华为 CANN 约 160+ 主流模型、兼容性约 95%——剩下最难的 5%(大规模训练调优)才是真卡脖子。硬件 TFLOPS 差 1.5–2 倍可补,生态差近十年难补。
- HBM(第二硬):长鑫 HBM3 计划 2026 量产,海外已量产 HBM4,落后 3–4 年;国产 HBM 产能仅约全球需求 13%;良率低导致国产 HBM3 出厂价较国际高 30–50%。
- 先进制程产能(被 EUV 锁死):中芯无 EUV,靠 DUV 多重曝光硬凑 7nm,良率约台积电 70%、成本更高;EUV 禁运下 5nm 以下基本无解。这是国产算力单芯片的"天花板"。
COMPETITIVE LANDSCAPE & MOAT
06竞争格局与护城河:CUDA 才是那道墙
波特五力,逐条速读:
① 买方议价权 · 强:大厂+运营商集中采购、被政策推着多供应商,压价能力强。
② 供方议价权 · 极强:台积电 CoWoS、SK 海力士 HBM 卡全球脖子,国产被迫自建上游。
③ 新进入者 · 暴增:四小龙+大厂自研,2025 一年挤进 5 家上市,赛道极度拥挤。
④ 替代品威胁 · 中:英伟达 H200/B30 特供卡若大规模回流,分流高端需求。
⑤ 现有竞争 · 失衡:昇腾一家独大(份额 20%),其余在剩余份额里贴身肉搏。
份额迁移趋势:国产 AI 芯片在中国市场份额
2023 ~15% → 2024 ~30% → 2025 ~41%(详见
§04 S 曲线);英伟达从四年前 95% 一路退到 55%(数据中心口径对华更已近零)。这是一条政策强力推动、三年翻三倍的份额迁移曲线——也是整个主题的"势"。
✎ 为什么 CUDA 是真护城河
硬件可以堆量追平,软件生态差近十年——这决定"国产到底能替到几成"
| 维度 | 英伟达 CUDA | 国产现状 |
| 生态积累 | 2006 年起,约 20 年 | CANN 2021 / MindSpore 2018,落后近十年 |
| 模型覆盖 | 23,000+ 模型 | 昇腾 CANN ~160+ 主流模型 |
| 开发者 | ~400 万 | 迁移知识成本 >60%;90%+ 开源项目基于 CUDA |
| 应对路线 | — | 两条路:① CUDA 兼容(摩尔 MUSA / 沐曦 / 海光 ROCm)降迁移成本;② 自建生态(华为不兼容 CUDA,2025-08 全面开源 CANN,赌长期自主) |
核心判断:硬件差距(约 1.5–2 倍,可靠堆量+先进封装弥补)远小于软件生态差距。CUDA 是真正护城河,也是"国产替代到底能替到几成"的最大变量——推理已可替,训练端的大规模调优仍被生态卡住。
6.1 护城河评级(per name)
华为昇腾 Narrow 自有生态+国资+规模
中芯国际 Narrow 先进制程稀缺性
寒武纪 None→Narrow 纯设计、生态弱
北方华创 Narrow 平台型设备
长鑫 HBM None 追赶中
英伟达 Wide CUDA 网络效应
U.S. & GLOBAL EQUITIES
07海外对标公司:标尺在哪、谁是真瓶颈
| 公司 | 代码 | 市值(USD) | 最新季营收(YoY) | 毛利率 | 赛道占比* | TTM PE | Fwd PE | AI 链角色 | 护城河 |
| 英伟达 | NVDA | $5.08T | $81.6B (+85%) | 75% | 数据中心 92% | 32.5x | 21.4x | AI GPU 垄断 + CUDA | Wide |
| AMD | AMD | $827B | $10.3B (+38%) | 55% | 数据中心 ~52% | 169x | ~58x | 唯一规模二供 | Narrow |
| 台积电 | TSM | $2.29T | $35.9B (+40.6%) | 66.2% | HPC 58% | 34.8x | 27.1x | 先进制程 + CoWoS 真瓶颈 | Wide |
| 三星电子 | 005930.KS | $1.49T | — | ~43% | HBM 占比小** | 27.5x | ~10x* | 代工 + HBM 双角色 | Narrow |
| SK 海力士 | 000660.KS | $1.12T | ₩97.15T (FY25 +47%) | ~62% 毛利 | HBM ~50%+ | 23.3x | ~7x* | HBM 全球龙头 ~59% | Wide |
市值/估值 as-of 2026-06;NVDA 为 Q1 FY27(2026-05 发布)。SK 海力士营收为 FY2025 全年 ₩97.15T(约 $68B)。*赛道占比=该公司营收中来自 AI/数据中心/HPC 的比重,看"含金量"(巨头不等于该赛道龙头)。**三星内存仅占整体约三成、HBM 更小,故下方对比图剔除三星说明原因。*带星 Forward PE 为存储深周期估算:峰值 EPS 上的低前瞻 PE,须警惕周期回落(见 §10 分歧 / §13 情景)。来源:CNBC / Capital.com / fullratio / SK Hynix FY25 PR / TrendForce 等,2026。
关键认知(颠覆直觉):真正的 AI 算力瓶颈不在 GPU 设计,在封装与 HBM。台积电 CoWoS 产能 2026 底约 12.7 万片/月(扩 80% 仍 sold out,英伟达独占一半+)、SK 海力士 HBM 市占 59% 且供不应求至 2028。所以——中芯对标台积电、长鑫对标 SK 海力士的难度,可能高于华为昇腾对标英伟达单芯片设计。国产替代真正的硬仗在制造端,不在设计端。
CHINA EQUITIES · 资本市场地图
08国产标的:谁在哪上市、估值多烫
这是你的问题 ④ 的上市地图部分。一句话格局:2025–2026 是国产算力 IPO 大潮——摩尔线程、沐曦登科创板,壁仞、天数智芯赴港股,燧原科创板过会。设计端"四小龙"几乎一年内集体上市,估值普遍透支。
8.1 A 股 / 港股重点标的
| 公司 | 代码/上市地 | 市值(RMB) | 2025 营收(YoY) | 盈利 | 算力占比* | TTM PE | Fwd PE 26e** | 护城河 |
| 寒武纪 | 688256 · 科创板 | ~8,000 亿元 | 前三季 46.07 亿 (+2386%) | 净利 16 亿,扭亏 | ~100% | ~430x | ~90x | None→Narrow |
| 海光信息 | 688041 · 科创板 | ~6,500 亿元 | H1 54.64 亿 (+45%) | 净利 12 亿 | DCU ~40% | ~196x | ~85x | Narrow |
| 中芯国际 | 688981 / 0981.HK | A 股 ~1.0–1.25 万亿 | 前三季 495 亿 (+18%) | 毛利 ~20% | 先进制程~15% | ~178x | ~45x | Narrow |
| 摩尔线程 | 688795 · 科创板 | ~3,000–4,000 亿元 | —(首日 +425%) | 亏损 | ~100% | 亏损 | 亏损·看 PS | None |
| 沐曦股份 | 688802 · 科创板 | ~3,000 亿元 | 在手订单 ~14.3 亿 | 累亏 >30 亿 | ~100% | 亏损 | 亏损·看 PS | None |
| 壁仞科技 | 港股 2026-01 上市 | >1,300 亿港元 | — | 三年半累亏 63 亿 | ~100% | 亏损 | 亏损·看 PS | None |
| 天数智芯 | 09903.HK | —(超额 293 倍) | H1 出货 15,700 片 | 亏损 | ~100% | 亏损 | 亏损·看 PS | None |
| 燧原科技 | 科创板 2026-06 过会 | 拟募 60 亿(未上市) | 前三季 5.4 亿 | 亏损·腾讯占 50%+ | ~100% | 亏损 | 亏损·看 PS | None |
| 北方华创 | 002371 · 创业板 | ~5,230 亿元 | 前三季 273 亿 (+33%) | 净利 51 亿 | 泛半导体设备 | ~40x | ~30x | Narrow |
| 景嘉微 | 300474 · 创业板 | — | 7.2 亿 (+54%) | 净利 -1.65 亿 | 图形为主 | 亏损 | 亏损·看 PS | None |
市值/PE as-of 2026-06(寒武纪股本扩张后总市值约 8,000 亿+,TTM 动态 PE ~430x 仍处高位,2025-08 峰值曾达 ~514x)。*算力占比=营收中来自 AI 算力的比重(中芯先进制程占比低、北方华创为泛半导体设备,故"巨头≠纯算力标的")。**Fwd PE 26e 中带 ~ 为券商一致预期估算;多数设计端 2026 仍亏损,无意义的 PE 应改看 PS(寒武纪一度 111x PS、行业均 ~40x,远高于 NVDA 前瞻 PE 21x)。设备/封测部分公司精确市值为数据缺口。未上市但关键:华为昇腾、长江存储、长鑫存储(拟 2026 上市,目标估值 ~420 亿美元)。来源:同花顺/雪球/东方财富/各公司公告,2025–2026。
8.2 中美同图对比:营收差百倍,估值反而更贵
✎ 中美对比 · 5 张图看懂"revenue ≠ value"的反面
这个赛道最反直觉的地方:国产标的营收只有海外巨头的零头,PE 却高出几倍——市场给的是"政策 + 稀缺"溢价
🇨🇳 中国🌐 海外
① 市值(USD bn)
② 年化营收(USD bn)—— 差距最触目惊心
③ 年化净利润(USD bn,估算)—— 真正"赚到钱"的差距
注:营收/净利对比为单季×4 年化口径(NVDA 用 Q1 FY27、TSM/AMD 用最新季),与 FY 实际略有出入(TSM FY25 实际约 $122B 营收/$55B 净利、SK 海力士 FY25 净利约 $30B、AMD FY25 实际约 $35B 营收);设计端"四小龙"净利为负,未入图。
④ 毛利率(%,统一毛利口径)
⑤ Forward PE(倍)—— 国产更贵
SK 海力士/三星为存储深周期股,处 HBM 周期顶部、峰值 EPS 上前瞻 PE 极低(~7–10x),与高成长 AI 名估值不可同口径比,未入此图。
⑥ 估值溢价从何而来?
国产算力 PS(寒武纪一度 111x、海光 33x、行业均 ~40x)远高于美股巨头(英特尔 ~4x、英伟达前瞻 PE 仅 21x)。英伟达增速 85% 却只给 21x,寒武纪营收基数小 50 倍却给数百倍 PE。溢价 = ① 政策稀缺性(国家战略、真能量产的 AI GPU 屈指可数)+ ② 替代天花板想象(把"未来吃下英伟达让出的中国市场"提前贴现)+ ③ 科创板资金抱团、首日动辄 +600%。风险对照:这套溢价依赖①持续放量②良率产能跟上③政策不退坡,任一证伪即触发"一周蒸发 1,600 亿"式回调(寒武纪、摩尔、沐曦都发生过)。
COMPANY PROFILES · 公司名片
8.5逐家大白话名片:这些公司到底是谁
给完全没看过这些公司的读者一张张名片。💡 每张第一行=一句话记住它。分"设计端 / 制造端 / 上游设备"三组。
A · 设计端(画图的)
华为昇腾 未上市 Narrow
💡 国产算力唯一的"航母级"玩家,自己定芯片、自己建生态。
来头:华为海思自研,达芬奇架构 + CANN 软件栈。国产 AI 芯片绝对龙头,2025 出货 ~81 万颗、份额 20%。
客户 / AI 抓手:字节、阿里、运营商;H20 断供后最大受益者。CloudMatrix 384 超节点是它的杀手锏。
现状:910C 良率仍是瓶颈,不兼容 CUDA、赌自有生态,2025-08 全面开源 CANN。
寒武纪 688256 None→Narrow
💡 "国产 AI 芯片纯设计第一股",报表暴涨的代表。
来头:2016 成立、2020 科创板上市。思元(MLU)系列云端训推芯片。
客户 / AI 抓手:原大客户集中度高(一度 70%),2025 起客户分散;订单爆发带动营收一年增 24 倍。
现状:市值数千亿、动态 PE 上百倍,估值争议最大的标的之一。
海光信息 688041 Narrow
💡 "中国版 AMD",DCU 血缘来自 AMD 授权,软件迁移最省力。
来头:源自 AMD x86/GPU 授权,深算 DCU 走 ROCm 兼容路线。2025-06 换股吸收合并中科曙光。
客户 / AI 抓手:信创 + 智算,合并曙光后覆盖芯片→服务器→云全链条,合并后市值或超 4,000 亿。
现状:盈利能力在设计端里最好(H1 净利 12 亿),但 ROCm 授权血缘是长期变量。
摩尔线程 688795 None
💡 "国产 GPU 第一股",全功能 GPU(图形+计算+AI)。
来头:2020 成立,自研 MUSA 架构走 CUDA 兼容路线。2025-12 科创板上市,88 天过会创最快纪录。
客户 / AI 抓手:MTT S5000 原生 FP8,主打降迁移成本。
现状:上市首日 +425%、市值冲 4,000 亿后回调 ~40%;仍亏损。
沐曦股份 688802 None
💡 "史上最赚钱新股",首日涨近 7 倍。
来头:曦云 GPGPU 系列(对标 A100 档),MXMACA 软件栈走 CUDA 兼容。2025-12 科创板上市。
客户 / AI 抓手:在手订单 ~14.3 亿;新一代 C600 2025 底进风险量产。
现状:累计亏损 >30 亿、13 个季度未盈利,最早 2026 才可能盈亏平衡。
壁仞 / 燧原 / 天数智芯 None
💡 "GPU 四小龙"剩下三家,团队多来自英伟达/AMD。
壁仞:BR100 对标 A100,2026-01 港股上市,三年半累亏 63 亿。
燧原:腾讯系(腾讯占营收 50%+),2026-06 科创板过会,拟募 60 亿。
天数智芯:天垓(训练)/智铠(推理),2026-01 港股上市超额认购 293 倍,累计出货 5 万+片。
B · 制造端(代工/封装/存储)
中芯国际 688981 / 0981.HK Narrow
💡 国产先进制程唯一现实选择,昇腾的"代工厂"。
来头:国产晶圆代工绝对龙头,A+H 两地上市,A 股市值破万亿。
AI 抓手:N+1/N+2 等效 7nm 代工华为昇腾 910B/C,靠 DUV 多重曝光(无 EUV)。
现状:8 寸月产能破 100 万片、利用率 95.8%;但 AI 专用产能 2027 仍仅 ~18K 片/月——产能是真瓶颈。
长鑫存储 CXMT 未上市 None
💡 国产 HBM 的全部希望,对标 SK 海力士。
来头:国产 DRAM 主力,DDR5 良率破 80%。HBM 是 AI 芯片第二硬卡脖子。
AI 抓手:已向华为交付 HBM3 样品(MR-MUF 封装),计划 2026 量产、2027 HBM3E。
现状:落后海外 3–4 年(对方已 HBM4),拟 2026 上市、目标估值 ~420 亿美元。
通富微电 / 长电科技 002156 / 600584 Narrow
💡 国产"先进封装"主力,替代台积电 CoWoS 的曲线救国。
通富微电:2.5D 已通过昇腾 910B 验证,也为 AMD MI 系列封装;2025 前三季营收 201 亿。
长电科技:封测行业第一,2025 前三季营收 287 亿;XDFOI 类 CoWoS 方案。
现状:2026 被称"国产 CoWoS 元年",月产能向 2,000–2,500 片爬坡,良率仍在追。
长江存储 YMTC 未上市 Narrow
💡 国产存储里最接近"不卡脖子"的一环。
来头:NAND 闪存龙头,自研 Xtacking 架构,2022 全球首发 232 层。
AI 抓手:已实现 ~270 层 3D TLC 商业化,目标 2026 底冲全球 NAND 供应 15%。
现状:被列实体清单,挑战在全国产化产线设备/材料,而非堆叠技术本身。
C · 上游设备 / EDA / 光刻机
北方华创 002371 Narrow
💡 国产半导体设备"平台型一哥",A 股半导体盈利王。
来头:刻蚀/薄膜/炉管/清洗全覆盖,2025 前三季营收 273 亿、净利 51 亿。
AI 抓手:国产替代 + AI 扩产双驱动,市值 ~5,230 亿。
现状:盈利稳健、估值相对理性,是设备端最确定的标的之一。
中微 / 华海清科 / 拓荆 / 盛美 Narrow
💡 各守一个细分设备环节,强项已突破。
中微 (688012):刻蚀机,已进 5nm 验证,设备国产化率 >95%。
华海清科 (688120):CMP 抛光绝对龙头,国内份额 ~40%。
拓荆/盛美:薄膜沉积 / 清洗设备,营收高增。
上海微电子 SMEE 借壳中 None
💡 最硬卡脖子的那一环——国产光刻机。
来头:国产光刻机唯一玩家。2025-05 交付首台 28nm 浸没式 DUV,国产化率 >90%。
AI 抓手:支撑 7nm 多重曝光;EUV 仅样机、规划 2026 小批量。
现状:DUV 产能 ~10 片/h vs ASML ~170 片/h,约 8 年代差;EUV 与 ASML 是代际级差距。
华大九天 301269 None→Narrow
💡 国产 EDA"最接近全流程",但先进制程仍缺。
来头:国产 EDA 龙头,对抗 Synopsys/Cadence/Siemens 三巨头(占全球 74%)。
AI 抓手:2025-06 美国一度要求三巨头停供,直接催化国产替代。
现状:研发吞噬利润(2025 净利暴跌),并购整合是当前主路径。
ORDERS & BUSINESS REALITY
09订单怎么体现、目前有什么问题
这是你的问题 ③。订单从三个地方"露头":① 上市公司报表(营收/合同负债/存货);② 运营商与政府智算中心集采招标;③ 大厂资本开支转向国产。但有订单 ≠ 交得出货——产能和良率是最大现实问题。
9.1 订单如何体现
| 渠道 | 具体体现 | 数据 |
| 设计端报表暴增 | 寒武纪营收/存货/合同负债 | 2025 前三季营收 +2386%;存货 37 亿(备货扩张) |
| 运营商集采 | 中国移动 2025–26 AI 推理服务器集采 7,058 台 | 2,058 套类 CUDA + 5,000 套 CANN(昇腾) |
| 政府最大单笔集采 | 百度昆仑芯中标移动集采 | 三标包拿 70% / 70% / 100%,十亿级 |
| 大厂采购转向 | 字节/阿里/美团首次大规模采购国产 | 单超节点成本约 2 亿元 |
| 大厂自研放量 | 阿里平头哥 / 百度昆仑芯出货 | 平头哥 2026-02 累计交付 47 万颗;昆仑芯 2025 +350% |
| 昇腾产业链订单 | 盛合晶微 CoWoS 产能专供昇腾 | 目标 2026 月产数万片 |
9.2 目前存在的五大问题
① 产能不足,有订单交不了货
中芯 AI 专用产能 2027 仍 ~18K 片/月;国产 HBM 2026 中国需求缺口约 300–400 万堆;CoWoS 月产能仅数千片。"卖得出、造不够"是最大现实矛盾。
② 软件生态不成熟
CUDA 迁移成本 >60%,90%+ 开源 AI 项目基于 CUDA。国产卡"能买、不好用",训练端调优痛点突出。
③ 良率低 → 成本高
910C 良率 ~30–40%;国产 HBM3 出厂价较国际高 30–50%。良率直接吃掉国产替代的性价比优势。
④ 估值泡沫 + 利用率存疑
寒武纪动态 PE 一度 514x;更扎心的是 2025 上半年全国智算中心利用率仅 ~32%,部分国产集群闲置率高达 80%——"建了不一定用得起来"。
⑤ 政策/补贴依赖:国产替代订单高度依赖运营商集采、政府智算中心招标和信创政策回款。海光自己提示"随信创回暖、政府回款加速,销售有望回暖"——反过来说,政策节奏与回款就是这个赛道的命门。一旦财政或政策退坡,需求的"硬度"会打折。
✎ 直接回答:"需求这么强,怎么还有应收账款/闲置风险?"
需求强 ≠ 现金回得快,也 ≠ 算力用得起来
应收账款=货已发、收入已确认、钱还没到(账期问题)。增长越快应收越大,真风险在回款时点和单一客户集中(如燧原靠腾讯 50%+)。闲置率高=智算中心一窝蜂建、但算法架构/供应链/运维跟不上,导致"建好没满负荷跑"。这两个都不是"需求假",而是"需求真、但兑现链条有摩擦"——这正是把"国产替代"从主题做成现金流时最容易栽的地方。
KEY DEBATES · VARIANT VIEW
10市场最大的分歧点 + 我方观点
分歧 1 · 国产替代是真需求,还是政策补贴吹的泡沫?
市场共识
泡沫论:2025H1 智算中心利用率仅 32%、部分集群闲置 80%,建完即退场。
我方观点
需求总量真实(大厂两万亿、阿里芯片七成投国产是硬订单),但结构性错配——不是没需求,是供需/运维没对齐。不是泡沫,是早期摩擦。
判据 / 证伪
看 2026–27 智算中心利用率能否从 32% 回升到 60%+。若持续低于 40%,泡沫论成立。
分歧 2 · 昇腾能不能真正替代 H100?
市场共识
"昇腾对标 H100"——媒体常态化表述。
我方观点
分场景:推理已可替代(910C 反超 H20);训练端单卡性能/显存带宽仍逊,且 CUDA 95% 兼容意味着最难的 5%(大规模训练调优)仍卡脖子。"系统级替代"成立,"单芯片替代"被夸大。
判据 / 证伪
看头部大模型公司是否用纯昇腾集群完成千亿级模型预训练(非微调/推理)。做到了,替代论坐实。
分歧 3 · 制程锁死 7nm 后,算力天花板在哪?
市场共识
EUV 禁运,中芯困于 7nm,单芯片密度受限 = 天花板已现。
我方观点
华为押"τ 定律"——不靠先进光刻,用系统级/多 die 堆叠换密度。短期能用"堆量+组网"绕过,但能效比(电费、机房、散热)是隐性天花板,且最先进训练拼的是能效。
判据 / 证伪
看 CloudMatrix 类超节点的每 FLOP 能效能否从 GB200 的 1/2.3 追到 0.8 以上。
分歧 4 · H200 放开,是否冲垮国产替代逻辑?
市场共识
利空:H200 带 25% 附加费回流,高端训练需求被分流。
我方观点
影响有限且强化自主信仰:政策可逆性已被反复证明(H20 禁→解→H200),大厂不敢押单一供给;且 Blackwell 仍禁,最先进卡依旧买不到。短期分流、长期加固国产。
判据 / 证伪
看大厂 2026 国产采购比例是否因 H200 回落。阿里"七成投国产"若下修,利空成立。
分歧 5 · 设计端 vs 制造端,钱该押哪头?
市场共识
追设计端"四小龙"——弹性大、故事性强、首日翻几倍。
我方观点
真瓶颈和真利润在制造端(中芯产能、长鑫 HBM、先进封装、设备)。设计端营收暴增但普遍亏损、估值透支;制造/设备端(北方华创)盈利实、估值相对理性。"做设计拿份额,做制造拿利润。"
判据 / 证伪
看 2026 设计端能否在放量同时实现正现金流。做不到,则制造端的"卖铲人"逻辑更稳。
DEEP DIVE · CHINA vs ASML/TSMC/SK
11卡脖子深拆:差距到底是"做不出"还是"高端做不好"
✎ 直接回答
一句话定性:六大环节里只有两个是"代际级、近完全做不出"
光刻机(EUV)和 HBM 是仅有的两个代际级卡脖子点(代差 3–8 年);其余环节(代工、封装、设备、标准存储、EDA、材料)多是"能做、但高端良率/产能/份额不够"——属"渐进追赶"而非"完全做不出"。所以"国产替代"在中低端已成立,真正的硬墙是 EUV 和 HBM 这两块。
| 环节 | 代表玩家 | 卡脖子性质 | 量化代差 |
| 光刻机 EUV | 上海微电子 SMEE | 最硬·近"完全做不出" | DUV 刚交付(28nm)·产能 10 vs ASML 170 片/h·约 8 年;EUV 仅样机 |
| HBM | 长鑫 CXMT | 第二硬·量产代际落后 | HBM3 2026 量产·落后 SK 海力士 3–4 年(对方已 HBM4) |
| 晶圆代工(先进) | 中芯国际 | 能做但产能/良率不够 | 等效 7nm 量产·无 EUV·良率约台积电 70%·AI 产能严重不足 |
| 先进封装 | 通富/长电 | 能做·良率爬坡 | 2.5D 已量产验证·CoWoS 类良率仍有缺口 |
| DRAM/NAND(标准) | 长鑫/长江存储 | 基本做得出·追高端 | NAND 232 层已量产领先·DDR5 良率破 80% |
| 设备(刻蚀/CMP/清洗) | 北方华创/中微 | 多数能做·强项突破 | 刻蚀/CMP/清洗国产化率破双位数~50%·量检测/光刻仍弱 |
| EDA | 华大九天 | 点状能做·全流程缺 | 三巨头占 74%·国产无先进制程全流程·断供风险高 |
| 材料 | 沪硅/安集/雅克 | 中低端能做·高端依赖进口 | 大硅片/抛光液局部突破·前驱体国产化率 ~40% |
11.1 最硬的两块,再拆细一层
光刻机:为什么 8 年代差是"代际级"
- ASML EUV 禁运直接锁死中芯 5nm 以下,这是所有先进制程的总开关。
- SMEE 2025-05 交付首台 28nm 浸没式 DUV(等效 134nm,可支撑 7nm 多重曝光),但产能 ~10 片/h vs ASML ~170 片/h。
- 核心短板在光源:中科院全固态 DUV 光源 70mW/6kHz vs ASML 100–120W/8–9kHz,差数量级。
- EUV 仅样机阶段,规划 2026 小批量——与 ASML 已进 High-NA 量产是代际差距。
HBM:为什么代差是"台阶式拉大"
- 长鑫 HBM3 已交样(MR-MUF 封装,源自 SK 海力士路线),计划 2026 量产、2027 HBM3E。
- 但海外 HBM4 已在 2025–26 量产——长鑫量 HBM3 时对方已量 HBM4,差一代到一代半。
- HBM3→HBM4 带宽提升约 3 倍、整体性能比 HBM3E 高 ~60%,代际不是线性而是台阶。
- 国产 HBM 产能仅约全球需求 13%,良率低导致价格高 30–50%。
11.2 路线图:芯片走哪条路、绕开哪个卡点
设计 · 中国
华为/寒武纪
画图纸(绕不开 EDA:华大九天补点、三巨头仍主导)
→
代工 · 中国
中芯
7nm DUV 多重曝光(绕开 EUV,代价是良率/产能/成本)
→
存储 · 中国
长鑫
国产 HBM3(最大短板,2026 才量产)
→
封装 · 中国
长电/通富
类 CoWoS(绕开台积电封装产能限制)
→
系统 · 中国
CloudMatrix
超节点堆量(用组网绕开单芯片制程劣势)
这条"曲线救国"路线的逻辑:每一个被卡的点(EUV、HBM、CoWoS、单芯片制程),都用"次优方案 + 系统级堆叠"绕过去——可行,但每一步都付出良率/能效/成本的代价。
WINNERS & LOSERS
12谁受益、谁受害
这是你的问题 ④ 的后半部分。国产替代是一场价值再分配:英伟达让出的中国市场,流向国产设计 + 制造 + 信创整机;但短期内中国云厂商承担"性价比下降"的代价。
▲ 受益方
国产 GPU 设计商份额昇腾、寒武纪、摩尔、沐曦、壁仞、燧原、昆仑芯、平头哥——2025 国产交付 165 万颗、占中国市场 41%。
中芯国际利润+稀缺国产先进制程唯一现实选择,市值破万亿,AI 代工排队。
设备 / HBM 上游最确定北方华创、中微、华海清科、长鑫、长江存储——"卖铲人",扩产即受益、盈利实。
先进封装CoWoS 元年长电、通富——替代台积电封装产能。
信创服务器整机下游集成浪潮信息、中科曙光、紫光股份——承接智算中心集采。
▼ 受害方
英伟达 NVDA失中国市场数据中心对华营收已近零;H20 计提 45 亿美元;中国占总营收 26%(2022) → 17%(FY24) → 13%(FY25) → ~0(数据中心)。但全球 AI 需求太强,整体仍创纪录——"失之中国,收之全球"。
依赖英伟达的中国云厂商短期阵痛字节/阿里/腾讯被迫用生态更弱、性价比更低的国产替代,迁移成本高、单超节点约 2 亿元。
台积电 TSM影响有限中国客户流失,但仍是全球 CoWoS/先进制程核心,市值 2.29 万亿美元、订单 sold out——几乎无感。
✎ 直接回答:"英伟达丢了中国,为什么股价还创新高?"
因为全球 AI 需求的增量,远大于中国市场的损失
英伟达数据中心营收单季 $75B(+92%),中国数据中心贡献已被压到约零——但它整体营收仍创纪录、毛利率回到 75%(不再有 H20 库存计提)。换句话说,中国市场对英伟达从"重要"变成"放弃也无所谓"。这对国产替代是双刃剑:好处是国产在中国市场没有英伟达正面竞争(被管制挡在门外);坏处是国产卡只能内循环,难以走向全球与英伟达硬碰硬。
BULL / BASE / BEAR
13三情景与证伪条件
▲ 牛市
概率 ~25%
中芯产能/良率快速爬坡,长鑫 HBM3 2026 顺利量产,CUDA 迁移工具成熟。国产份额 2027 突破 60%,设计端实现正现金流,估值从"故事"切到"业绩"。
触发:智算利用率回 60%+、纯昇腾集群完成千亿级预训练。
● 基准
概率 ~55%
国产在推理大规模替代、训练仍部分依赖进口;份额稳步升至 50%+ 但被产能/HBM/良率持续拖累。设计端分化(龙头活、尾部出清),制造/设备端稳健兑现。估值高位震荡、挤泡沫。
最可能路径:主题真实、兑现慢、波动大。
▼ 熊市
概率 ~20%
HBM/光刻持续卡死,良率上不去;H200/B30 大规模回流分流需求;财政退坡、智算闲置率高企暴露。设计端高估值标的"一周蒸发千亿"式回调,主题降温为"政策概念"。
触发:阿里国产采购比例下修、利用率持续 <40%、又一轮 IPO 破发。
CATALYST CALENDAR
14催化剂日历(未来 12–24 个月)
2026 Q1关键
华为昇腾 950PR 发布(推理 Prefill/推荐),全年出货目标 75 万颗
2026 初利好
长鑫 HBM3 量产(良率 >80%)——国产 HBM 关键节点
2026 H1关键
"国产 CoWoS 元年":长电/通富月产能向 2,000–2,500 片爬坡
2026 Q2–Q3利好
昇腾 910D 大规模量产(5nm/4Die/FP8,~1000T,传闻待证)
2026 全年关键
字节 ~2000 亿、阿里三年 3800–4800 亿资本开支落地 → 大厂招标节奏
2026关键
长鑫存储拟上市(目标估值 ~420 亿美元);燧原科创板挂牌
2026 Q4利好
华为昇腾 950DT 发布(推理 Decode + 训练)
持续利空
美国管制更新:H200 附加费 / Blackwell 是否松动 / Entity List 扩容
2027关键
央国企核心系统须完成全面国产化替代(政策硬约束);长鑫 HBM3E
RISKS & BOTTOM LINE
15风险矩阵与结论
15.1 风险矩阵
| 类别 | 风险 | 概率 | 影响 |
| 技术 | EUV/HBM 持续卡死,先进制程无法突破 | 高 | 高 |
| 供给 | 产能/良率上不去,有订单交不了货 | 高 | 高 |
| 需求 | 智算中心闲置率高、利用率不及预期 | 中 | 中高 |
| 政策 | H200/B30 大规模回流分流;财政补贴退坡 | 中 | 中 |
| 估值 | 设计端上百倍 PE,业绩证伪即剧烈回调 | 高 | 高 |
一句话定调
国产算力替代是国家战略级、确定性最高的"方向",但兑现路径最颠簸的"赛道"。需求被管制逼成刚需、份额三年翻三倍——但真瓶颈(EUV 光刻、HBM)3–8 年无解,设计端营收基数极小却给上百倍估值,最该看的反而是利润和卡脖子都在手里的制造/设备/HBM 上游,而非首日翻几倍的设计端"四小龙"。主题做多、个股挑剔。Setup 3/5。
- 玩家分类(问题①):设计端华为昇腾领跑+寒武纪/海光/四小龙;制造端中芯(代工)+长鑫(HBM)+长电通富(封装);上游设备北方华创等+光刻机上海微电子(最硬)。
- 核心数据(问题②):昇腾 910C 单芯片约 H100 的 60–79%、集群可反超;国产份额 41%;最硬差距是 EUV(8 年)和 HBM(3–4 年)。
- 业务情况(问题③):订单从报表暴增、运营商集采、大厂转向三处露头;最大问题是产能不足+生态不成熟+良率低+估值泡沫+政策依赖。
- 资本市场(问题④):2025–26 IPO 大潮,设计端集中上市、估值透支;受益=国产设计/制造/设备/信创整机,受害=英伟达(失中国但收全球)、短期中国云厂商;台积电几乎无感。
免责与数据口径:本报告为内部研究参考,非投资建议。主用口径:份额/出货量以 IDC 为准,市场规模金额以中商产业研究院/券商为准(两者勿混),海外财务以最新季报为准(NVDA 为 Q1 FY27),股价/市值 as-of 2026-06。已知数据缺口:部分设备/封测公司精确市值、燧原/沐曦精确算力规格、长鑫/长江存储产能(未上市不披露)、910C/910D 部分规格为第三方传闻。算力数字注意精度口径(FP16/FP8 不可直接横比)。护城河评级与情景概率为本报告判断。媒体常态化的"X 进入英伟达供应链""全面对标 H100"已做谨慎核实/修正——本报告未见任何国产设计公司进入英伟达供应链,方向恰相反(英伟达让出中国份额给国产)。