文 | 时间线Timelines,,,,作者 | 赵明,,,,编辑 | 周易
在喧嚣与动荡中,,,,国产芯片们的 AI 算力生意,,,,正在被互联网大厂们进一步翻开。。。。
6 月中旬,,,,外媒爆出新闻,,,,字节跳动正与天数智芯洽谈采购至少 5 万颗AI芯片,,,,主要用于推理使命。。。。本次洽谈涉及的芯片,,,,主要为天数智芯智铠系列云端推理 GPU,,,,训练场景则使用天垓系列。。。。
到了 6 月下旬,,,,又有新闻称,,,,字节跳动还在思量使用百度昆仑芯的产品,,,,该新闻很快被字节方面否认——然而很快,,,,又有新闻爆出,,,,阿里巴巴也在接触天数智芯,,,,很可能成为它的下一个客户。。。。
在相关新闻满天飞的同时,,,,资源市场同样是行动一直。。。。
好比,,,,字节采购的相关新闻传出当天,,,,天数智芯港股股价一度拉升近15%,,,,三天后更是触达887.5 港元的历史高位。。。。而到了 6 月 30 日盘中,,,,受到多重新闻影响,,,,寒武纪的股价突破又历史高点,,,,市值突破 1 万亿元。。。。
与之陪同的另一个新闻是,,,,百度旗下 AI 芯片公司昆仑芯妄想赴港上市,,,,其被曝出的目的估值约 500 亿美元。。。。这一数字不但凌驾百度自身约 360 亿美元的市值,,,,也较其 2025 年 7 月 D 轮融资后 210 亿元人民币的投后估值,,,,暴涨了逾 15 倍。。。。
受到昆仑芯上市新闻影响,,,,百度港股的股价当日盘中涨幅也突破 8%。。。。
凡此种种,,,,纷歧而足——都是国产 AI 算力厘革大潮中的朵朵浪花。。。。
若是总体看护,,,,一方面是互联网巨头与国产算力供应商的新闻一直,,,,一方面是国产算力玩家在资源市场的叱咤风云——这种在手艺、市场、资源层面的风云激荡,,,,成为目今中国本土市场 AI 和算力自己同时走向爆发的大情形下,,,,一道很是有数的商业异景。。。。
从一家独大到国产补位
要明确当下的国产 AI 算力厘革大潮,,,,我们无妨把时间拉回十年前。。。。
2016 年,,,,AlphaGo 横空出生点燃了 AI 浪潮,,,,同年英伟达首次将 GTC 大会带入中国。。。。以后数年间,,,,依附 CUDA 软件生态的深挚壁垒,,,,英伟达险些垄断了中国 AI 加速卡市场 ——2021 年其市占率凌驾 80%,,,,2022 年进一步攀升至 85%。。。。
彼时,,,,华为昇腾占比仅 10%,,,,百度昆仑芯 2%,,,,寒武纪仅 1%。。。。
2022 年 10 月,,,,随着美国政府宣布对华高端芯片出口管制步伐,,,,英伟达旗下的 A100、H100 等旗舰产品直接断供。。。。只管英伟达随后推出 A800、H800 等 「特供版」,,,,但 2023 年 10 月管制再度升级,,,,特供芯片也无法进入中国市场。。。。
到 2025 年,,,,就连性能大幅阉割的 H20 也基本阻止出货,,,,英伟达 CEO 黄仁勋果真坦言:「在中国的市场份额已从 95% 降到 0」。。。。
外部供应的闸门收紧,,,,恰恰撞上内部需求的爆炸。。。。
大模子浪潮之下,,,,AI 算力需求呈指数级增添。。。。2024 年头,,,,海内日均 Token 挪用量仅为 1000 亿。。。。到 2025 年底跃升至 100 万亿,,,,增添超千倍。。。。阻止 2026 年 3 月,,,,日均挪用量已突破 140 万亿。。。。
摩根大通更是在 2026 年 2 月的报告中给出了一个惊人的展望:从 2025 年到 2030 年,,,,中国 AI 推理 Token 的消耗量,,,,将从约 10 万万亿增添到约 3900 万万亿,,,,五年间增添约 370 倍。。。。
Token 消耗量暴增的另一端,,,,正是关于算力自己快速爆发的需求。。。。
关于国产算力来说,,,,在英伟达高端算力缺位的情形下,,,,这种需求自己就是一个千载难逢的历史性补位机缘。。。。
事实上,,,,这一补位历程,,,,在 2025 年就已经最先。。。。
IDC 数据显示,,,,2025 年中国 AI 服务器市场共交付 400 万颗 AI GPU,,,,其中国产芯片占比已达 41%;;;仅华为昇腾一家就出货约 81.2 万张,,,,百度昆仑芯和寒武纪则划分出货约 11.6 万张,,,,并列第三,,,,海光信息、摩尔线程和天数智芯也有小比例斩获。。。。
而到 2026 年,,,,在 AI 算力层面全方位国产替换的浪潮下,,,,这一补位机缘被前所未有地放大。。。。
值得注重的是,,,,在市场自己调理供需的同时,,,,政策端也在为这一补位历程同步托底。。。。
2026 年 5 月 26 日,,,,中国信息清静测评中心、国家保密科技测评中心首次将 AI 芯片纳入清静可靠认证系统,,,,9 款国产人工智能训练推理芯片获评最高品级 I 级——从名单来看,,,,华为海思、阿里平头哥、壁仞科技、海光信息、天数智芯、沐曦股份、摩尔线程等国产算力玩家的产品,,,,都悉数在列。。。。
许多人忽略了这个认证的主要性——但从主要性上来说,,,,这份认证清单,,,,事实上成为了政企及要害领域采购的准入目录,,,,为国产芯片翻开了更辽阔的市场空间。。。。
虽然,,,,在这条从「完全依赖入口」到「规;;;婊弧沟乃懔ひ道甯镏飞,,,,尚有另外一批主要玩家——甚至说,,,,站在这场厘革最前沿的,,,,正是需求最迫切、资金最丰裕的互联网大厂。。。。
互联网大厂的 AI 算力蹊径图
面临重大的训练推理算力缺口,,,,中国的互联网大厂们的应对战略惊人地一致:周全拥抱国产芯片,,,,构建多供应商系统,,,,训推疏散、降本增效。。。。
但详细到每一家,,,,打法又截然差别。。。。
字节跳动:应用倒逼,,,,推理先行
字节跳动是海内 AI 算力需求最兴旺的公司之一。。。。
QuestMobile 数据显示,,,,阻止 2026 年 5 月,,,,豆包月活用户已达 3.68 亿,,,,日均 Token 挪用量突破 120 万亿。。。。用户规模的几何式增添,,,,带来了推理算力的重大压力。。。。
这也决议了字节的算力战略:适用主义至上,,,,先从替换门槛最低的推理侧突破。。。。
现在,,,,字节已形成清晰的三级供应链系统:训练侧以华为昇腾为主,,,,2026 年头签下约 25 万颗大单,,,,金额近 300 亿元;;;推理侧接纳双供应商战略,,,,寒武纪与天数智芯并行。。。。
此次 5 万颗天数智芯智铠系列订单,,,,正是推理侧规;;;婊坏囊σ徊,,,,若所有交付,,,,天数智芯将成为字节第三大国产 GPU 供应商。。。。
在资笔僻出层面,,,,据多家媒体援引《南华早报》新闻,,,,2026 年字节 AI 基础设施资源开支预算上调约 25% 至 2000 亿元,,,,更有人称,,,,字节正思量将开支上限推至 700 亿美元。。。。而凭证行业测算,,,,其国产芯片采购金额预计超 400 亿元。。。。
别的,,,,尚有新闻称,,,,字节也在悄悄结构自研芯片,,,,其内部研发的 SeedChip 云端推理芯片团队已超千人,,,,接纳三星 6nm 工艺,,,,2026 年 3 月完成流片,,,,年内妄想小批量量产 10 万颗,,,,所有用于抖音、豆包等自有场景,,,,差池外销售。。。。
百度:全栈自研,,,,分拆上市
百度是互联网大厂中造芯历史最久、自研最彻底的一家。。。。
早在 2011 年,,,,百度就启动了 FPGA AI 加速器项目,,,,初志很质朴——降低搜索营业的算力本钱。。。。关于这个,,,,李彦宏曾回忆:「当初做搜索,,,,买别人的芯片每片要 1 万美元,,,,我们自己做,,,,2 万元人民币就做下来了,,,,以是就逼着自己做。。。。」
正所谓,,,,无心插柳柳成荫。。。。
2018 年国际形势蓦地生变,,,,同年百度宣布了昆仑 1 代 AI 芯片,,,,全栈 AI 的雏形初显。。。。到 2021 年 4 月,,,,昆仑芯从百度分拆自力,,,,首轮估值 130 亿元。。。。自力初期,,,,昆仑芯 90% 以上收入来自百度内部采购,,,,实质上仍是百度的「芯片部分」。。。。
2023 年,,,,昆仑芯进入生长快车道。。。。2024 年第三代 P800 芯片量产,,,,2025 年建成海内首个 3.2 万卡全自研 AI 集群,,,,同年中标中国移动十亿级集采项目——这是昆仑芯走出百度内循环的标记性事务。。。。
阻止 2025 年底,,,,昆仑芯已累计完成数万卡安排,,,,外部客户收入占比凌驾 50%,,,,客户笼罩运营商、金融、互联网等多个行业——要害是,,,,腾讯、拼多多等互联网大厂,,,,均在昆仑芯的采购名单之列。。。。
值得一提的是,,,,2026 年一季度,,,,百度 AI 相关收入达 136 亿元,,,,占总营收的 52%,,,,其中 GPU 云收入同比增速高达 183%——而昆仑芯正是背后的焦点支持。。。。
2026 年 1 月,,,,昆仑芯以保密形式向港交所提交 A1 上市申请;;;5 月启动科创板上市向导;;;6 月 500 亿美元估值的新闻传出,,,,资源市场已经给出了正向反馈——可以说,,,,昆仑芯走向资源市场,,,,已经成为百度 2026 年最主要的使命之一。。。。
阿里巴巴:云芯一体,,,,生态制胜
若是说百度走的是「芯片 + 模子」的闭环蹊径,,,,阿里的棋路则更弘大:以云为载体,,,,构建 「芯片 + 云 + 开源模子」的全栈生态。。。。
阿里的造芯结构始于 2018 年。。。。彼时美国加大科技封锁,,,,阿里迅速全资收购国产嵌入式 CPU 企业中天微,,,,并整合达摩院芯片研发团队,,,,正式建设平头哥半导体。。。。时任阿里巴巴集团 CTO 张建锋说得很明确:「我们必需要做资源可控、手艺可控、有焦点竞争力的事情,,,,最底层的就是芯片。。。。」
与其他大厂聚焦简单赛道差别,,,,平头哥从一最先就瞄准了完整的算力基础设施。。。。八年时间里,,,,其产品矩阵笼罩了数据中心险些所有焦点芯片:
AI 推理芯片含光 800,,,,2019 年宣布即拿下全球推理性能第一,,,,昔时双 11 就大规模安排于淘宝主搜;;;
服务器 CPU 倚天 710,,,,5nm 工艺,,,,是中国互联网公司首款通用服务器 CPU;;;
真武系列 AI 芯片,,,,其中真武 PPU 累计出货量已突破 60 万片,,,,2026 年 Q1 在海内 AI 芯片厂商中跃居第二,,,,首次逾越寒武纪;;;
别的尚有镇岳系列 SSD 主控芯片、磐脉系列智能网卡、ICN Switch 互联芯片等,,,,实现算力、网力、存力全栈自研。。。。
据 IDC 最新报告显示,,,,阻止 2026 年 Q1,,,,平头哥真武 PPU 芯片累计出货量已突破 60 万片,,,,在海内 AI 芯片厂商中跃居第二,,,,首次在规模上逾越寒武纪,,,,成为华为昇腾之外最具竞争力的玩家。。。。
生态层面,,,,阿里的打法极具章法:通过通义千问开源模子吸引全球开发者,,,,再将开发者流量导流至阿里云,,,,最终发动底层自研芯片的规;;;才拧!。。
值得一提的是,,,,吴泳铭上任阿里巴巴 CEO 后,,,,明确提出未来三年围绕 AI 硬件基础设施投资 3800 亿元,,,,平头哥正是这一战略的焦点支点。。。。
腾讯:资源绑定,,,,系统为王
与前三家相比,,,,腾讯的算力战略显得格外「榨取」——不硬刚通用 GPU,,,,而是走「投资绑定 + 系统优化」的务实蹊径。。。。
在芯片自研上,,,,腾讯没有追求大而全,,,,仅聚焦与自身营业强相关的专用芯片,,,,包括 AI 推理、视频转码、智能网卡等偏向。。。。而在通用 AI 芯片赛道,,,,腾讯选择用资源绑定焦点相助同伴——燧原科技就是最典范的案例。。。。
燧原科技招股书显示,,,,腾讯科技及其关联方合计持有燧原科技 20.26% 股份,,,,是其最大机构股东。。。。同时,,,,腾讯也是燧原的第一大客户:2023-2025 年,,,,燧原对腾讯的销售收入从 1 亿元增添至 8.3 亿元,,,,占总营收的比例从 33.34% 攀升至 83.79%,,,,三年实现 8 倍增添。。。。
双方的相助始于 2019 年,,,,早期接纳 AVAP 模式(燧原向腾讯指定的服务器厂商供货),,,,2025 年转为直接销售,,,,三代 AI 加速卡大规模落地腾讯内部场景,,,,包括微信语音转文字、腾讯聚会纪要、内容明确、广告推荐等上百个营业场景。。。。
对燧原而言,,,,腾讯不但是订单泉源,,,,更是最佳的手艺试验场。。。。
依托腾讯的海量场景,,,,燧原的算子库、工具链、软件生态一连迭代完善,,,,大幅降低了后续服务其他客户的迁徙本钱。。。。现在燧原已进入拓客第二阶段,,,,多家头部互联网客户与运营商客户已完成测试并最先小批量交付。。。。
而从腾讯的角度,,,,算力需求的暴涨,,,,与国产算力的导入,,,,形成了很显着的营业共振。。。。
2025 腾讯全球数字生态大会上,,,,腾讯宣布周全适配主流国产芯片,,,,通过异构盘算平台的软件能力整合差别芯片。。。。而在财报电话聚会上,,,,腾讯治理层果真披露,,,,2026 年 AI 投入将至少翻倍至 360 亿元以上,,,,不但云云,,,,2026 年下半年大规模导入国产算力。。。。
值得一提的是,,,,已往几年间,,,,腾讯在二级市场一再脱手,,,,入股了一大批 AI 公司。。。。
其中,,,,在 AI 芯片和底层算力领域,,,,腾讯先后投资了燧原科技、曦智科技、云豹智能、无问芯穹、集益威半导体等公司;;;其中,,,,腾讯在燧原科技和云豹智能的持股比例靠近 20%,,,,为第一大股东。。。。
华为:国产算力的底层压舱石
若是说字节、百度、阿里、腾讯四家是国产算力落地的「需求发念头」,,,,那么华为昇腾就是支持起整个国产算力系统的 「底层压舱石」。。。。
作为海内唯一能在高端训练场景形陋习;;;桓兜谋就了懔ν婕,,,,它险些是所有互联网大厂训练侧的配合选择,,,,也是整个国产替换历程中最焦点的支柱实力。。。。
在本土 AI 芯片赛道,,,,华为昇腾的市园职位一骑绝尘。。。。
IDC 数据显示,,,,2025 年华为昇腾 AI 加速卡出货量达 81.2 万张,,,,位居海内市场第一,,,,占昔时国产 AI 芯片总出货量的近一半,,,,规模远超第二名平头哥数倍之多。。。。
行业测算显示,,,,2026 年华为昇腾 AI 处理器营业收入将突破 120 亿美元,,,,进一步拉开与死后玩家的差别。。。。
产品矩阵上,,,,华为昇腾已形成笼罩训练与推理的完整结构:面向高端训练的昇腾 910 系列,,,,是目今国产性能最强的 AI 训练芯片;;;面向推理与边沿场景的昇腾 310 系列,,,,已普遍落地于各行各业。。。。
2025 年 9 月,,,,在华为全链接大会上,,,,华为宣布了清晰的 AI 芯片迭代蹊径图:2026 年推出昇腾 950 系列训练与推理芯片,,,,2027 年迭代至昇腾 960,,,,2028 年推出昇腾970,,,,逐代缩小与国际顶尖水平的差别。。。。
与此同时,,,,华为还正式宣布了超节点架构与自研「灵衢」高速互联协议,,,,推出昇腾 384 超节点、Atlas 950/960 SuperPoD 等全系列产品——这些产品将成为国产 AI 算力的重器。。。。
对互联网大厂而言,,,,华为昇腾是训练侧算力的「刚需级」选项,,,,也是各家国产算力结构中绕不开的焦点底座。。。。
字节跳动的训练侧国产算力焦点正是华为昇腾,,,,2026 年头双方签下约 25 万颗芯片的大单,,,,总金额近 300 亿元,,,,支持豆包大模子的全量训练与迭代。。。。
阿里巴巴同样是昇腾的主要客户,,,,年采购规????纱 15 万颗量级,,,,其通义大模子与阿里云服务均完成了与昇腾算力的深度适配;;;腾讯也将昇腾纳入焦点供应商系统,,,,年采购规模约 4-5 万颗,,,,支持混元大模子与内部营业场景的训练需求。。。。
某种水平上,,,,华为昇腾已经成为海内大模子训练的「行业标准底座」。。。。
无论是头部互联网大厂,,,,照旧第二梯队的模子创业公司,,,,都将昇腾作为国产逊с力的首选方案。。。。这种 「底座统一、上层多元」的名堂,,,,也在客观上降低了整个行业的适配本钱,,,,加速了国产算力的普及速率。。。。
国产芯片玩家的突围之路
由互联网巨头的算力深度结构,,,,也在国产芯片厂商引发了联动效应。。。。
在已往很长一段时间里,,,,国产芯片公司的客户名单上主要是政府采购和中小企业。。。。而现在,,,,字节、阿里、腾讯、百度的名字最先频仍泛起——这些订单不但带来了收入,,,,更带来了一张「大厂认证」的通行证。。。。
寒武纪是最具戏剧性的样本。。。。早年间,,,,寒武纪曾与华为短暂牵手——华为麒麟 970 搭载了寒武纪 1A 处理器,,,,成为「全球首款 AI 手机芯片」。。。。但双方很快分道扬镳,,,,华为转向自研昇腾,,,,寒武纪也走出了一条属于自己的 AI 芯片之路。。。。
2020 年 7 月,,,,寒武纪上岸科创板,,,,首日大涨近 300%,,,,市值突破 1000 亿元。。。。但以后数年,,,,寒武纪一连亏损,,,,2022 年底股价一度跌破刊行价。。。。市场上「PPT 造芯」「烧钱无底洞」的质疑声一直于耳。。。。
转折点泛起在 2025 年。。。。
昔时,,,,寒武纪整年营收 64.97 亿元,,,,同比增添 453%,,,,首次扭亏为盈,,,,彻底终结了一连八年亏损的历史。。。。2026 年一季度,,,,寒武纪营收 28.85 亿元,,,,靠近 2025 年整年的一半。。。。更要害的是,,,,谋划活动现金流从上年同期净流出 13.99 亿元转为净流入 8.34 亿元。。。。
支持这些数字的,,,,是大厂订单的集中涌入。。。。
2024 年,,,,字节跳动孝顺了寒武纪 79.15% 的营收。。。。2026 年头,,,,寒武纪新一代旗舰芯片思元 690 实现量产。。。????焖偈逝淠芰Τ晌沟憔赫;;;DeepSeek-V4 宣布当天,,,,寒武纪就宣布完成适配,,,,这种「Day 0 适配」的机制是赢得大厂信任的要害。。。。
业绩亮眼之下,,,,寒武纪的股价随之狂飙,,,,赢得「寒王」之名——到了 2026 年 6 月 30 日,,,,寒武纪的市值突破万亿元,,,,成为科创板首家万亿市值公司。。。。
天数智芯的故事,,,,甚至可以说是国产 GPU 创业史的一个缩影。。。。
2015 年,,,,前甲骨文数据库部分研发总监李云鹏去职回国,,,,在上海闵行开办了天数智芯——这个时间节点,,,,比摩尔线程早了 5 年,,,,比壁仞科技早了 4 年。。。。但他坚持做边沿侧 AI 推理芯片,,,,与看好通用 GPU 偏向的投资人爆发分歧,,,,最终出走。。。。
以后,,,,天数智芯治理层两度更迭。。。。曾任紫光集团联席总裁的刁石京接棒,,,,主导了向通用 GPU 赛道的要害转折。。。。2021 年,,,,天数智芯推出中国首款量产通用 GPU「天垓 Gen 1」。。。。2022 年,,,,盖鲁江成为新掌舵人。。。。
现在,,,,天数智芯接纳「训练 + 推理 + 边沿」三条腿走路。。。。在软件生态上,,,,天数智芯选择了深度兼容 CUDA 的务实蹊径,,,,80% 以上代码可以平滑迁徙。。。。
更引人注目的是,,,,天数智芯也提出了所谓的「三年四代架构」蹊径图:2025 年天枢架构落地,,,,2026 年天璇对标英伟达 Blackwell,,,,2027 年天权目的逾越英伟达 Rubin 架构。。。。
天数智芯在 2026 年 1 月上岸港交所,,,,股价也是一起狂飚;;;而在「字节跳动 5 万颗芯片大单」的新闻下,,,,天数智芯在资源市场的关注度抵达新高。。。。
而被称作国产 GPU 四小龙的摩尔线程、沐曦股份、壁仞科技、燧原科技也在各自觉力——短短半年时间,,,,四家即将在资源市场完玉成员集结。。。。
摩尔线程是最靠近英伟达全功效蹊径的国产厂商。。。。首创人张建中曾担当英伟达全球副总裁、中国区总司理,,,,在英伟达事情凌驾 15 年。。。。他很清晰英伟达的护城河在那里——不但是芯片性能,,,,更是 CUDA 生态对开发者的锁定。。。。
以是摩尔线程的 MUSIFY 工具链直接瞄准了无缝迁徙:CUDA 程序险些可以原封不动地跑在 MUSA 架构上。。。。张建中的原话是:「MUSA 的目的历来不是做一个 CUDA 的替换品,,,,而是要让 CUDA 开发者无缝迁徙到国产平台,,,,真正实现即插即用。。。。」
值得一提的是,,,,2026 年第一季度,,,,摩尔线程首次实现了季度盈利。。。。
沐曦股份的首创人陈维良曾恒久就职于 AMD,,,,他一经主导完成 MI100 等 15 款高性能 GPU 的流片与量产。。。。在这一配景下,,,,沐曦走的是「训推一体」蹊径,,,,MXMACA 软件栈开源,,,,开发者用户超 15 万——旗舰产品曦云 C600 实现了天下产供应链闭环。。。。
但硬币的另一面是资金压力:2022 年到 2025 年,,,,沐曦股份累计亏损了凌驾 30 亿元。。。。
壁仞科技的着力点是通用图形处理器(GPGPU)芯片及智能解决方案。。。。其中,,,,它在 2022 年宣布的 BR100 芯片,,,,单芯片峰值算力达 PFLOPS 级别,,,,突破了其时国际巨头坚持的通用 GPU 全球算力纪录。。。。
2026 年 1 月,,,,壁仞科技上岸港交所,,,,上市首日大涨超 82%。。。。
与壁仞科技相比,,,,燧原科技的打规则完全差别。。。。
首创人赵立东和 COO 张亚林均来自 AMD,,,,但他们没有选择「做一款通用芯片然后满天下找客户」的路径,,,,而是从一最先就与腾讯深度绑定——由腾讯提出需求,,,,燧原做极致的针对性优化。。。。
招股书显示,,,,腾讯持有燧原 20.26%股份,,,,是最大机构股东,,,,同时也是第一大客户: 2023-2025 年,,,,燧原对腾讯的销售收入从 1 亿元增添至 8.3 亿元,,,,占总营收比例从 33% 攀升至 84%。。。。三代芯片已在腾讯内部适配上线数百个营业场景。。。。
2026 年 6 月,,,,燧原科技过科创板上市审议,,,,拟募资 60 亿元。。。。
前路尚且漫漫
互联网大厂订单涌入、股价狂飙、估值暴涨……国产算力的故事听起来一片灼烁。。。。但硬币的另一面,,,,国产芯片厂商依旧面临诸多挑战。。。。
最焦点的挑战是软件生态。。。。
中国工程院院士郑纬民曾一针见血的指出国产 GPU 的焦点痛点:「国产 AI 芯片焦点问题是生态不敷好,,,,若是生态好,,,,性能做到 60% 也有人用。。。。」
已往十多年,,,,英伟达真正的护城河历来不但是 GPU 硬件自己,,,,而是「CUDA+ 硬件」配合组成的软件生态。。。。全球数百万开发者早已习惯 CUDA 的编程模子、工具链与调试系统,,,,大宗 AI 框架、算子和行业模子都建设在 CUDA 之上。。。。
以 CUDA 为基本,,,,编译器、调试器、数学库、通讯库、深度学习框架,,,,一个重大兴旺的热带雨林才得以生长。。。。英伟达之以是能提升为 AI 芯片之王,,,,靠的正是 CUDA 这套深入开发者骨髓的软件生态。。。。而这恰恰是是国产 GPU 的软肋。。。。
其次是产能瓶颈和供应链风险。。。。
尤其集中在高端 AI 加速卡、HBM、先进封装等环节。。。。沐曦股份的逆境是一个缩影:主力芯片曦云 C500 由中芯国际代工接纳 12nm 工艺,,,,而英伟达 H100 依托台积电 4nm——两代制程工艺的差别,,,,短期内无法填补。。。。
更深层的风险,,,,在于外部供应链的不确定性。。。。
四小龙中,,,,摩尔线程的 7nm 芯片由台积电代工,,,,壁仞科技的 CoWoS 封装依赖台积电,,,,沐曦和燧原的 14nm 芯片主要由中芯国际生产。。。。美国若扩大装备出口限制,,,,产能可能受到严重影响。。。。寒武纪接纳 Fabless 模式,,,,公司及部分子公司已被列入实体清单,,,,供应链稳固性始终保存隐忧。。。。
最基础的挑战,,,,或许是商业闭环尚未走通。。。。
互联网大厂之以是愿意在国产算力上投入巨额资金,,,,焦点驱动力是供应链清静和本钱控制。。。。前者是战略考量,,,,后者是商业盘算。。。。但到现在为止,,,,国产算力的性价比优势主要体现在采购价钱上——单颗芯片比英伟达自制,,,,这确实能降低推理本钱。。。。
问题是,,,,采购本钱只是总算力本钱的一部分。。。。适配本钱、运维本钱、因性能差别导致的特殊集群规模投入——这些隐性本钱往往被忽略。。。。
更大的问号来自需求端。。。。
互联网大厂之以是需要云云海量的推理算力,,,,是由于大模子应用正在爆发。。。。但大模子自己何时能实现规;;;,,,,至今仍是未解之谜。。。。各家大模子用户量激增不假,,,,但商业化仍处于早期探索。。。。B 端 API 收入增添迅速但基数小,,,,C 端订阅模式远未跑通。。。。
一面是百亿级别的芯片采购与数据中心建设投入,,,,一面是远缺乏以笼罩投入的模子收入。。。。投入与产出的铰剪差仍在扩大。。。。
换言之,,,,从久远来看,,,,国产算力的商业闭环,,,,不取决于芯片自己,,,,而取决于 AI 应用能否真正赚钱。。。。芯片公司现在赚的是大厂的资源开支预算,,,,但要实现可一连增添,,,,最终需要大模子应用从本钱中心酿成利润中心。。。。
这也是包括互联网大厂在内的所有 AI 玩家必需体贴的课题。。。。
另外,,,,国产算力玩家普遍在获客群体上依旧较为简单。。。。以寒武纪为例,,,,2024 年字节跳动孝顺了 79.15% 的营收。。。。燧原科技对腾讯的销售收入,,,,占总营收比例已攀升至 84%。。。。天数智芯若是拿下字节 5 万颗订单,,,,字节也将成为其最主要的客户。。。。
这种深度绑定在短期内是增添引擎,,,,但恒久来看,,,,大客户战略调解——包括自研芯片——都可能带来风险。。。。
这其中,,,,对自力芯片创企而言,,,,怎样从「一家客户养活一家公司」走向「多家客户配合支持」,,,,是必需跨越的商业化门槛。。。。这意味着不但要打磨芯片性能,,,,还要建设开放的软件生态,,,,降低新客户的迁徙本钱,,,,建设起不依赖于简单客户关系的自力竞争力。。。。
这条路比拿下一张大单更难,,,,但也更靠近可一连的增添。。。。
从 2022 年英伟达断供到今天,,,,不到四年时间,,,,中国 AI 芯片工业完成了一次结构性跃迁。。。。一经不起眼的国产芯片,,,,已经在大模子推理侧站稳了脚跟。。。。一经疏散的工业链实力,,,,正在通过订单、投资、标准和大规模应用汇聚成一个初具规模的国产算力生态。。。。
但这场替换远未完成。。。。训练侧的攻坚还在继续。。。。软件生态的培育需要更长时间。。。。商业闭环的最终验证,,,,取决于 AI 应用能否进入真正的收获期。。。。自力芯片公司从大厂附庸走向自力玩家的蹊径,,,,同样漫长。。。。
但可以确定的一点是:在互联网大厂的助力之下,,,,整个国产 AI 芯片行业的问题,,,,不再是「有没有」,,,,而是「好欠好」。。。。而接下来的重大磨练,,,,不再是某一家在手艺和商业层面单点突破的能力,,,,而是整个国产 AI 算力工业链上下游协同进化的耐心与刻意。。。。
路漫漫其修远兮,,,,仍需我辈上下而求索。。。。
7日午后到黄昏部分区域预计有疏散性雷阵雨