凯时AG

2026-06-18 16:38:35 设为首页 | 加入珍藏

字节跳动加量采购国产芯片

2026-06-18 16:38:35 宣布 泉源:天极下载 作者:?????∮ 浏览:8764次

本文字数:3033,,,阅读时长约莫5分钟

作者 |第一财经 吕倩 陈杨园

字节跳动数据中心建设希望再添新新闻,,,行业人士称字节跳动正与天数智芯讨论采购至少5万颗AI芯片,,,主要用于推理事情。。

据记者多方相识,,,本次洽谈供货芯片主要用于大模子推理负载,,,对应天数智芯智铠系列云端推理GPU,,,训练场景使用天垓系列。。若生意告竣,,,天数智芯将成为华为和寒武纪之后,,,字节跳动的第三家GPU供应商。。

阻止发稿,,,字节跳动与天数智芯方面暂未揭晓回应。。

以字节跳动为代表的互联网大厂加码自建数据中心,,,并非短期应急增补算力缺口,,,而是折射工业深层厘革:AI算力需求迎来结构性切换、企业算力自主可控战略一连升级,,,训推硬件分线结构与国产算力规;;;;;婊煌浇肼涞刂芷。。

投入自力数据中心建设

近年来,,,字节跳动在算力投入方面的动态一连更新。。

字节跳动明确训练、推理两套芯片供应链完全拆分:大规模模子训练接纳华为昇腾、寒武纪高端训练卡;;;;;线上C端豆包、企业MaaS海量并发推理引入天数智芯智铠系列等专用推理GPU。。

若本次洽谈落地,,,天数智芯将正式入局字节算力国界。。其中,,,华为昇腾聚焦集群训练、超大规模模子预训练底座;;;;;寒武纪兼顾部分中高端推理、笔直行业私有化安排;;;;;天数智芯智铠着重线上流量型海量推理主力供应。。

除了字节跳动,,,互联网大厂均在麋集结构数据中心,,,包括百度在天下结构万卡级AI算力集群规模;;;;;阿里巴巴2026财年单季度资源开支超380亿元,,,预估未来三年超3800亿元加码云和智算硬件;;;;;腾讯在天下多地建设腾讯云HCC高性能AI集群,,,2026年下半年大规模导入国产算力,,,同步对外提供混元大模子MaaS、游戏AIGC、视频天生推理服务。。

面壁智能AI Infra手艺认真人李宇轩对第一财经记者剖析称,,,互联网大厂麋集构建多供应商算力系统主要基于供应确定性、议价权与本钱结构,,,在大厂算力需求中,,,推理体量远大于训练,,,而推理对芯片的要求(互联、显存带宽、生态成熟度)比训练低一个台阶。。国产芯片在推理侧已达可用水平,,,这让更多供应商成为能落地的工程选择,,,而非纸面战略。。

同时,,,信创国产化是面向政企、央国企营业无规则避的硬性合规要求,,,多条手艺蹊径并行结构,,,能让企业保存手艺选择空间,,,不至于被简单厂商的硬件、生态迭代节奏约束。。沂景资源董事总司理谢思远以为,,,部分互联网厂商主要客户来自国企及要害行业,,,在算力系统建设历程中,,,通;;;;;嵩椒⒅厥庸芰τ胄糯词逝湟。。从生态匹配角度来看,,,现在互联网大厂与国产芯片厂商之间仍然保存不少要害障碍需要解决,,,双方还处于一连磨合和博弈的历程中。。

清微智能高级副总裁卢强对记者体现,,,互联网厂商推进算力供应链多元化,,,焦点原因不是简单的国产替换,,,而是需求、供应和供应链清静等多维度叠加。。大模子推理需求增添很快,,,外洋高端芯片供应受出口管制影响不确定,,,企业必需建设多供应商系统。。同时,,,国产芯片在推理场景的性价比、交付可控性和外地化服务能力提升后,,,已经从PoC验证进入规;;;;;才糯翱。。

竞争要害在于“谁的Token本钱更低”

站在市场经济逻辑视角,,,海内大规模数据中心投建,,,实质是下游AI算力真实需求一连释放带来的市场驱动效果。。

曦望Sunrise联席CEO王湛对记者体现,,,2026年海内大模子进入应用爆发期,,,DeepSeek V4等模子带来的Token市场爆发,,,Agent快速普及。。行业竞争的要害酿成了“谁的Token本钱更低”。。国产推理芯片在特定场景下的性价比和每瓦性能已有不错体现。。

详细场景包括大厂的高并发推理集群,,,如搜索推荐、智能客服、短视频多模态天生等场景,,,以及智能体应用,,,天天爆发数万亿次Token消耗,,,是现在国产推理芯片采购的最大金主;;;;;另一大场景是大模子头部企业与MoE架构的常态化训练与微调,,,随着MoE架构普及,,,行业对算力的调理与局部推理能力要求暴增。。

据灼识咨询全球AI推理芯片行业报告,,,AI芯片行业正从以训练为焦点向以推理为焦点的范式爆发根天性转变,,,AI推理芯片的需求正急剧增添,,,预计到2030年,,,全球AI推理芯片行业规模将抵达30696亿元人民币,,,其中中国AI推理芯片行业规模将抵达11664亿元人民币。。

优刻得新兴事业部副总司理刘华判断,,,接下来办公场景、营业AI化等需求仍会一直增添,,,推动算力需求兴旺,,,且AI行业3-5年内仍将处于高速生耐久。。

多重因素刺激下的推理需求激增,,,造成暂时的供需失衡。。王湛提到,,,市场泛起“一卡难求”,,,行业头部企业疯狂“抢”GPU卡、买内存、租数据中心、扩建推理算力等,,,导致整个供应链承压。。今年一季度,,,算力租赁本钱上涨近30%至40%,,,预计整年AI推理的算力需求抵达训练的4-5倍。。

卢强判断,,,欠缺客观保存,,,尤其集中在高端AI加速卡、HBM、先进封装、整机服务器等环节。。现在行业交付周期拉长、热门型号排产主要、整机报价随供需和内存价钱波动上行。。

谢思远预估,,,下半年随着行业竞争加剧,,,同质化征象将越来越显着,,,聚焦Token领域的价钱战将泛起,,,整体价钱反而可能呈下降趋势。。

国产算力生态追赶中

据香港理工大学研究能耗推算,,,在超大规模云端设置中由于“十亿级别”的用户高频请求,,,推理能耗已占AI总能耗约60%—90%。。另外,,,中国工程院指出,,,2026年一季度中国推理需求已抵达训练需求的8倍。。

交银国际研报剖析以为,,,这一结构性转变意味着,,,关于数据中心运营商而言,,,支持大规模推理使命的高密度、低延迟算力需求将成为增添主力。。随着国产GPU扩产在即,,,叠加超大型云厂商订单转动释放,,,预计2026年下半年项目落地节奏将较上半年进一步加速。。

预计今年二季度新模子开发与存量模子迭代仍将支持需求韧性。。同时,,,企业端和客户端推理逻辑需求一直提升,,,正成为行业中恒久驱动力。?????勺魑词惫┯υ霾沟氖葜行脑擞逃型栏阶试春涂突д承蕴嵘荻。。

刘华以为,,,只管保存短期压力,,,但中恒久看,,,英伟达供应压力会增进国产算力的生长。。“现在国产卡由于产能和适配问题供货一时上不来,,,但会逐渐放量,,,这是一个此消彼长的历程”,,,他体现。。

受地缘出口管制约束,,,海内工业虽短期内仍需采购英伟达高端算力作为增补,,,但具备替换能力的国产算力生态已进入规;;;;;ㄉ杪涞亟锥。。

包括字节跳动在内的海内互联网厂商,,,短期靠采购解决需求,,,中期靠国产多供应商降低风险和本钱,,,恒久靠自研将利润留在自己手里。。类似谷歌TPU逻辑,,,自研芯片焦点目的不是卖给他人,,,而是尽可能挣脱被动田地。。

大厂内部营业多元、场景富厚,,,因此训练、精调、高并发推理、图像处理对算力的要求差别。。多供应商系统允许他们用A芯片做大规模训练,,,用B芯片做长文本推理,,,用C芯片做轻量级边沿盘算,,,有利于实现TCO最优化。。

谢思远对记者体现,,,互联网大厂构建多供应商算力系统的焦点考量是性价比。。大厂们实质希望以尽可能低的本钱获得更多可用算力资源。。关于互联网大厂而言,,,无论接纳哪家供应商的产品,,,最终都要回到本钱、性能和稳固性的综合较量上。。在供应受限的配景下,,,降低对简单厂商的依赖风险是须要的,,,但这更多是一种风险治理需求。。真正决议采购规模和采购比例的,,,仍是现实安排后的经济性体现。。

相较而言,,,古板智算中心肩负了工业培育和基础设施建设的功效角色,,,相比现实使用率,,,发动国产芯片企业营收增添和工业生长越发主要,,,互联网云厂商建设算力网络实质上属于市场化行为。。

在此趋势下,,,行业处于从“可用验证”走向“规模使用”的阶段性节点。。已往客户更多看单卡指标,,,现在看千卡、万卡集群稳固性与单位本钱。。大订单会显着改善厂商收入、现金流和供应链议价能力,,,但行业名堂不会只靠一两个订单决议,,,最终仍由产品迭代、生态、交付和客户复购决议。。从算力市场角度来看,,,互联网厂商大规模结构数据中心仍将是一个要害节点。。

微信编辑| 雨林

:bianjibu@yicai.com

:business@yicai.com

夹娃娃成瘾?????香港拟修订《赌博条例》!

责任编辑:林旺瑜    校对:李舒华

今日热门

  1. 2026年六五情形日国家主场活动在广州举行
  2. 青海湖北岸迎来湟鱼洄游季
  3. 江苏淮安:初夏睡莲绽放
  4. 新疆兵团:林下生“金” 特色兴业
  5. 郑丽文访美行程曝光
  6. 传习录丨奋斗是青春最亮丽的底色
  7. 国家医疗包管局宣布《2026年国家基本医疗包管、生育包管和工伤包管药品目录及商业康健包管立异药品目录调解事情方案》等相关文件
  8. 打好灾难提防“自动仗”——第18个天下防灾减灾日一线见闻
  9. 第三届“红旗杯”法兰克福国际龙舟节举行
  10. 天下杯近18万张门票待售

相关推荐

【网站地图】