凯时AG

2026-07-05 03:47:51 设为首页 | 加入珍藏

Rubin缩水背后 , ,,英伟达的CUDA神话正在松动

2026-07-05 03:47:51 宣布 泉源:网易游戏 作者:陈柏钧 浏览:5707次

两条看似无关的新闻 , ,,在6月最后一周先后落地。。。。 。。

6月25日 , ,,OpenAI宣布首款自研AI推理芯片Jalape?o , ,,与博通联手仅用9个月完成从设计到流片——这家全球最大的GPU买家 , ,,最先自己造芯片了。。。。 。。

6月30日 , ,,半导体研究机构SemiAnalysis在社交平台果真宣布:英伟达原版4芯片Rubin Ultra已在GTC 2026宣布仅三个月后遭作废 , ,,新版性能缩水近半。。。。 。。"这一切爆发的配景是 , ,,"该机构增补道 , ,,"英伟达的市场份额正在被侵蚀。。。。 。。"

而早在去年 , ,,媒体爆出Anthropic的年化营收已迫近70亿美元 , ,,旗下Claude Code在推出两个月内创立了5亿美元年化收入。。。。 。。而驱动这一切的算力底座 , ,,已经不再只有英伟达——谷歌TPU肩负训练、亚马逊Trainium认真推理、英伟达GPU退居为"研究探索"的第三选项。。。。 。。

三条新闻 , ,,指向统一个问题:CUDA护城河——英伟达最结实也最被神话的竞争壁垒——正在泛起裂痕。。。。 。。

87%到75% , ,,英伟达的"不可替换"正在瓦解

先看一组数字。。。。 。。

据Silicon Analysts基于英伟达/AMD财报及台积电产能分配数据的估算 , ,,英伟达在AI加速器市场。。。 。。ò词杖爰疲┑姆荻罟旒H缦拢

可以看到 , ,, 英伟达的收入仍在增添——从150亿到1500亿 , ,,四年十倍。。。。 。。但份额从87%岑岭滑向75% , ,,意味着增量市场中有越来越大的一块被切走了。。。。 。。

切走这块蛋糕的 , ,,不是某一个敌手 , ,,而是来自周围八方的竞争:谷歌TPU、亚马逊Trainium、微软Maia、Meta MTIA、博通定制的XPU——尚有刚加入的OpenAI。。。。 。。

博通CEO陈福阳在2026财年一季报电话会上透露了一个此前未果真的数字:博通AI半导体收入已抵达84亿年化运行率 , ,,同比增添10684亿年化运行率 , ,,同比增添106400-500亿的年度轨迹冲刺。。。。 。。这家公司已经签下了六个超大规模??突涠ㄖ艫I芯片 , ,,OpenAI是第六个。。。。 。。

换句话说 , ,,全球最大的几家云盘算公司和AI公司 , ,,不约而同地选择了统一个偏向:自己造芯片。。。。 。。

Anthropic的选择

若是说市场份额数据是酷寒的统计 , ,,那Anthropic的案例就是一个活生生的"去英伟达化"教科书。。。。 。。

Anthropic是现在全球增添最快的AI公司之一。。。。 。。 年化营收迫近70亿美元(2025年同期仅约10亿) , ,,服务凌驾30万家企业客户 , ,,大客户数目同比增添近7倍。。。。 。。Claude Code在推出两个月内创立了5亿美元年化收入 , ,,Anthropic称其为"史上增添最快的产品"。。。。 。。

而驱动这一切的算力底座 , ,,是一种被Anthropic CFO Krishna Rao称为"奇异盘算战略"的三平台架构:

注重最后一列。。。。 。。英伟达GPU排第三 , ,,不是并列 , ,,不是"备选" , ,,是三个选项里规模最小的谁人。。。。 。。

这不是一个缺钱的小公司在用廉价替换品拼集。。。。 。。这是全球第二大AI公司 , ,,在生产情形中 , ,,用非英伟达芯片驱动其增添最快的产品。。。。 。。

SemiAnalysis在6月30日的帖子中特殊点出了这一点:"Claude Code的推理事情有相当大一部分运行在Trainium上 , ,,Claude的训练在TPU上完成。。。。 。。就在一年前 , ,,TPU和Trainium能增添到这种规模 , ,,同时CUDA护城河被缓慢侵蚀 , ,,照旧难以想象的事。。。。 。。"

Anthropic为什么要这样做???不是由于TPU和Trainium比H100更强——在绝对性能上它们可能仍有差别。。。。 。。而是由于特定场景下 , ,,专有芯片的性价比远超通用GPU。。。。 。。训练用TPU , ,,由于谷歌给了几百亿美元的条约和百万颗芯片的供应允许。。。。 。。推理用Trainium , ,,由于AWS是其主要云服务商、已投资80亿美元 , ,,Project Rainier超算集群完全跑在Trainium 2上 , ,,没有GPU溢价。。。。 。。

亚马逊在Trainium上赌得很大。。。。 。。据其2026年一季报披露 , ,,Trainium产品线已获得凌驾2250亿美元的收入允许 , ,,客户包括OpenAI和Anthropic。。。。 。。AWS的AI收入运行率已凌驾150亿美元 , ,,Bedrock推理服务大部分跑在Trainium上。。。。 。。

这里的要害词不是"性能" , ,,是"本钱"。。。。 。。推理是天天都在烧钱的事。。。。 。。ChatGPT每次回覆问题、API每次返回代码 , ,,背后都是GPU在跑电。。。。 。。Anthropic用Trainium替换GPU做推理 , ,,不是为了跑得更快 , ,,是为了每花一美元算更多次。。。。 。。

三道侵蚀切口:CUDA护城河从那里裂开

CUDA之以是被视为英伟达最结实的护城河 , ,,是由于它构建了一个"硬件-软件-开发者"的关闭生态:

20年积累 , ,,400万+开发者所有主流ML框架优先为CUDA优化cuDNN、TensorRT、NCCL等优化库形成深度绑定切换本钱以年计 , ,,以亿美元权衡

但2026年的AI芯片竞争 , ,,不再是"做一个比H100快10%的GPU"——那是正面进攻 , ,,无人能赢。。。。 。。侵蚀来自三个侧面:

侵蚀路径一:自研ASIC——不打全战场 , ,,只切最肥的推理蛋糕

这是最致命的路径。。。。 。。它的逻辑不是"我能做得比英伟达好" , ,,而是"我不需要GPU的所有功效 , ,,我只需要推理"。。。。 。。

一块英伟达H100要做的事:图形渲染、科学盘算、AI训练、AI推理、视频编解码……一块Jalape?o只做一件事:运行OpenAI自己的模子举行推理。。。。 。。前者是瑞士军刀 , ,,后者是一把专砍一种木头的斧头——在特定使命上 , ,,斧头比军刀好用得多 , ,,也自制得多。。。。 。。

OpenAI Jalape?o的定位极其精准: 反面英伟达比万能 , ,,只在推理——这个天天消耗数十亿次API挪用、每年燃烧数亿美元本钱的场景——做到极致。。。。 。。OpenAI官方目的是降低30-50%的推理本钱。。。。 。。在天天烧掉数百万美元推理用度的体量下 , ,,这意味着每年节约数亿美元的纯利润。。。。 。。

并且OpenAI不是第一家。。。。 。。 微软Maia 200(2026年1月宣布)、谷歌TPU Ironwood(第七代 , ,,首款专为推理设计)、亚马逊Trainium 3——四大云厂商所有亮出了自研推理芯片。。。。 。。再加上Meta MTIA和苹果的定制芯片 , ,,全球前七大科技公司中 , ,,只有一家还在"只买不造"——而它也在路上了。。。。 。。

侵蚀路径二:AMD——从"保存"到"可信替换"

AMD的AI GPU收入从2022年的不到10亿美元飙升至2026年预计的150亿美元以上 , ,,四年凌驾15倍增添。。。。 。。

这背后的要害转折点是MI400系列。。。。 。;;贑DNA5架构、432GB HBM4内存、19.6 TB/s带宽 , ,,预计2026年下半年量产。。。。 。。S&P Global展望MI400单系列将孝顺72亿美元收入 , ,,占AMD数据中心营业的25%。。。。 。。

更主要的是客户端的信号。。。。 。。Meta已与AMD签署了高达6吉瓦的采购允许——这不但是AMD历史上最大的AI芯片订单 , ,,也是一个明确的信号:超大规模??突г谧龆喙┯ι探峁埂。。。 。。

AMD的局限同样显着:台积电CoWoS产能分配仅约11% , ,,而英伟达占有60%以上。。。。 。。产能天花板决议了AMD短期内无法对英伟达形成数目级攻击。。。。 。。但"可信的第二供应商"这个定位自己 , ,,就已经拆掉了"非英伟达不可"的叙事墙角。。。。 。。

侵蚀路径三:软件层解耦——Triton、JAX和"CUDA-Free"的未来

这是最容易被忽略、但恒久最危险的一条路径。。。。 。。

CUDA的绑定依赖于一个简朴事实:AI研究员写代码用PyTorch , ,,PyTorch底层跑在CUDA上。。。。 。。但若是PyTorch底层不再依赖CUDA呢???

这正在爆发。。。。 。。 PyTorch团队已履历证了使用Triton编译器可以实现"CUDA-Free"推理——在H100和A100上运行Llama 3模子 , ,,Triton内核天生的token吞吐量可与CUDA媲美。。。。 。。2026年2月 , ,,Triton推出了新的多后端支持 , ,,允许统一套代码编译赴任别硬件上——AMD GPU、英特尔GPU、甚至种种ASIC。。。。 。。

谷歌的JAX框架走得更远。。。。 。。它从一最先就设计为硬件无关——同样的代码可以在TPU、GPU甚至CPU上运行。。。。 。。Anthropic选择TPU举行训练 , ,,很洪流平上就是由于JAX让它们可以在不重写模子代码的条件下迁徙算力平台。。。。 。。

软件层的解耦意味着什么??? 意味着新一代AI研究员可能在从未写过一行CUDA代码的情形下 , ,,训练出最先进的模子。。。。 。。当开发者不再被锁定在CUDA生态中 , ,,"必需买英伟达"的硬逻辑就酿成了"可以买英伟达"的软选择。。。。 。。

Rubin Ultra作废:物理极限的分水岭

回到开篇的新闻。。。。 。。英伟达4芯片Rubin Ultra在宣布三个月后遭作废 , ,,被SemiAnalysis视为"制造执行层面的问题正在让更多市场份额流失"。。。。 。。

手艺原因并不重大。。。。 。。原版Rubin Ultra妄想将4颗盘算芯片+16个HBM4E内存模??榧稍诩虻シ庾澳 , ,,接纳台积电CoWoS-L工艺。。。。 。。但据Global Semi Research , ,,4芯片设置下泛起了封装基板翘曲——基板向多个偏向弯曲 , ,,导致盘算芯片无法与基板完全接触。。。。 。。信号传输失效 , ,,芯片基础无法事情。。。。 。。

台积电的备选方案CoPoS(面板级封装)要到2028年底才宇量产。。。。 。。英伟达等不起——以是新版Rubin Ultra回退到2芯片设计 , ,,性能缩水近半。。。。 。。

这件事的象征意义大于现实营业影响。。。。 。。

英伟达仍然会卖掉它能生产的每一块Rubin Ultra。。。。 。。但"从4芯片回退到2芯片"袒露了一个更深层的问题:英伟达的产品迭代速率 , ,,正在撞上物理极限的墙。。。。 。。 更大的芯片→更重大的封装→更高的缺陷率→要么延迟、要么缩水。。。。 。。这是一条不可无限延伸的曲线。。。。 。。

而与此同时 , ,,竞争敌手们正在用另一种方式绕过这面墙:不做更大的芯片 , ,,做更专用的芯片。。。。 。。

定价权的裂痕

英伟达的护城河真正不可撼动的部分 , ,,不是CUDA软件生态 , ,,是制造端。。。。 。。台积电60%的CoWoS先进封装产能握在它手里。。。。 。。这是物理壁垒 , ,,不是软件壁垒。。。。 。。竞争敌手可以写出更好的框架、设计出更高效的ASIC——但在出货量上追赶英伟达 , ,,首先要过台积电产能这一关。。。。 。。

但问题也就在这里:制造壁垒依赖的是一家第三方晶圆厂。。。。 。。它不是英伟达自己能控制的资产。。。。 。。

而英伟达88%的毛利率——H100本钱3320美元、售价28000美元——建设在一个条件上:客户无法脱离它。。。。 。。 若是这个条件从"无法脱离"酿成"性价比最优的选择" , ,,那定价权就不再是绝对的了。。。。 。。

Anthropic证实晰另一条路:不追求最好的芯片 , ,,追求最适合的芯片。。。。 。。训练用TPU而不是GPU , ,,不是由于TPU更快 , ,,而是由于谷歌给了足够多的芯片和足够好的价钱。。。。 。。推理用Trainium而不是GPU , ,,不是由于Trainium更强 , ,,而是由于AWS是战略股东 , ,,Project Rainier绕开了通用GPU的溢价。。。。 。。

当全球第二大AI公司把GPU降级为三大算力平台中最小的一块时 , ,,"必需买英伟达"这件事就不再是铁律了。。。。 。。

英伟达仍然是最好的。。。。 。。头部AI公司没有一个彻底脱离了它——Anthropic保存了一部分GPU用于"前沿研究探索" , ,,OpenAI的Jalape?o只做推理不做训练 , ,,Meta的MTIA只笼罩推荐系统和内容审核。。。。 。。

但从"只有英伟达"到"英伟达最贵 , ,,先用自制的" , ,,这中心的差别就是定价权的流失。。。。 。。

市场已经最先为这个可能性重新定价。。。。 。。今年以来 , ,,SemiAnalysis的每一次看空报告都引发相关板块强烈震惊:6月初SOCAMM削减新闻导致美光单日跌13% , ,,6月10日CPO延迟争议迫使英伟达高管出面辟谣 , ,,6月30日Rubin Ultra作废再度点燃讨论。。。。 。。

这些波动的背后 , ,,是市场在艰难回覆一个以前不需要回覆的问题:若是CUDA不是不可替换的 , ,,英伟达值几多钱。。。。 。。

记者在采访中发明 , ,,不少车主都遇到过类似问题:扫停车缴费码 , ,,最先跳出的不是付款页面 , ,,而是种种广告弹窗。。。。 。。广告关闭键藏得很深 , ,,有的要等倒计时 , ,,尚有不少假按钮 , ,,轻点就跳转多款App或者浏览器。。。。 。。不少人为了小额优惠重复操作 , ,,点错就得重新扫码 , ,,费时又闹心。。。。 。。

责任编辑:张绿江    校对:陈昆绍

今日热门

  1. 国台办回应美对台湾军购预算体现不满
  2. 黄河正式进入主汛期
  3. 2026年天下残疾人足球果真赛在京举行
  4. 百元集采药在药店卖3960元
  5. “压力越大越胖”怎么破??? 专家开出“三层减重法”
  6. 前5个月东北外贸收支口超5390亿元
  7. 《河南省献血条例》今起施行 多项优待步伐勉励无偿献血
  8. 马龙、谌龙、傅园慧、孙一文、李雪芮等 , ,,拟录取北京体育大学博士
  9. 法国遭遇高温热浪 民众戏水消暑
  10. 四川成都:司机突发脑梗 执勤哨兵伸援手

相关推荐

【网站地图】