凯时AG

协同优化 , ,,中国科技立异的破局点!

作者:韩姿蓉
宣布时间:2026-06-16 14:59:06
阅读量:6

协同优化 , ,,中国科技立异的破局点!

一边是AI赛道黑马DeepSeek获得国家集成电路工业投资基金、腾讯、宁德时代等多家巨头青睐 , ,,极有可能刷新国产大模子单轮融资纪录;;另一边是华为重磅宣布韬(τ)定律 , ,,跳出摩尔定律桎梏重构芯片生长逻辑。。 。

看似两家公司分处AI、半导体差别赛道 , ,,但底层都是用协同优化 , ,,找到了中国科技的破局点。。 。

DeepSeek突破AI规模缩放定律!

路透社6月3日报道 , ,,DeepSeek首轮融资额凌驾人民币500亿元 , ,,估值凌驾4000亿 , ,,国家集成电路工业投资基金入局 , ,,腾讯和宁德时代将成为最大的外部投资者。。 。这家从量化巨头——幻方量化内部孵化的AI企业 , ,,恒久依赖自有资金研发、坚持模子开源 , ,,不靠高价API收割利润 , ,,为什么能获得各路大佬青睐?????

多年以来 , ,,全球AI行业恒久信仰“更大都据+更多参数+更多GPU=更强模子”的AI规模缩放定律 , ,,只有一条路可以走——砸海量资金增添模子参数、囤上万张高端GPU堆算力 , ,,训练本钱动辄数万万美元 , ,,再用高收费回本。。 。

DeepSeek没有轻信。。 。2024年1月 , ,,DeepSeek还未宣布AI大模子 , ,,就先以“恒久主义视角”审阅AI规模缩放定律 , ,,要形貌“超参数” , ,,寻找差别预算下 , ,,怎样让大模子在差别预算的情形下抵达最佳性能(将本钱、性价比看法引入AI大模子领域)。。 。

这是DeepSeek的原始立异!

为了降低“最终本钱” , ,,DeepSeek在算法、训练模式、硬件和系统四个层面上举行了协同优化。。 。

在算法上 , ,,DeepSeek刷新了MoE混淆专家架构 , ,,每次推理只激活少数“专家”子系统 , ,,用“准确挪用”取代“全员上阵”。。 。好比DeepSeek V3总参数目6710亿 , ,,盘算一个Token时仅激活370亿参数 , ,,极大提高了性价比。。 。

在训练模式上 , ,,DeepSeek发明了倾覆性的GRPO算法 , ,,替换了古板算法的“演员-评审”机制 , ,,即需要同时训练两个模子 , ,,一个认真回覆问题 , ,,另一个认真给回覆打分反馈。。 。GRPO不再需要评审模子 , ,,只凭证规则对统一个问题的多个输出打分 , ,,让大模子跟自己回覆的平均值博弈 , ,,找出“准确偏向”。。 。效果证实 , ,,该算法不但让大模子涌现出推理能力 , ,,还极大降低了大模子的训练本钱 , ,,研究效果登上《自然》杂志封面。。 。

在硬件上 , ,,DeepSeek受制于美国的先进算力卡禁令 , ,,只能使用“阉割过的英伟达H800” , ,,就写出FlashMLA程序优化硬件 , ,,让大模子使用H800内存带宽的能力 , ,,从平均60%提升到95%。。 。

在系统层面 , ,,DeepSeek发明DualPipe , ,,给整个系统装上了GPU监工 , ,,时刻“鞭笞”闲置算力 , ,,将GPU使用率提升30%以上。。 。DeepSeek 还推出了DeepEP , ,,全球首个专门针对MoE的并行通讯库 , ,,优化跨节点通讯 , ,,确保协同的效率最大化。。 。

效果肉眼可见:一律性能下 , ,,DeepSeek推理定价仅为西欧大厂几十分之一!美国用户惊呼 , ,,改用DeepSeek V4以后 , ,,不但效果更好 , ,,并且用度降低90% +!

并且大模子开源之后 , ,,发动了整个AI行业的再次重构 , ,,虽然用了大宗前人的手艺和代码 , ,,但DeepSeek确实是一次重大的原始立异。。 。现实上所有原始立异都是源于组合立异。。 。

华为韬定律倾覆摩尔定律!

5月25日 , ,,华为半导体总裁何庭波在国际电路钻研会上正式宣布韬(τ)定律 , ,,全球半导体行业强烈震荡 , ,,外媒直言中国走出绕开EUV封锁的芯片自主新路。。 。

韬(τ)定律是华为的原始立异!

原始立异之处在于 , ,,第一次提出要把“韬(τ)定律”作为手艺进化的主要偏向。。 。之以是可以称之为原始立异 , ,,这是由于主攻偏向的差别 , ,,会爆发完全差别的生长路径。。 。

已往数十年 , ,,摩尔定律主导全球芯片生长:靠一直缩小晶体管物理尺寸、攻坚EUV光刻机向下冲刺先进制程 , ,,7nm、5nm、3nm芯片研发本钱指数级暴涨 , ,,3nm晶圆厂建设本钱百亿起步 , ,,行业盈利逐渐沦为苹果、英伟达等巨头专属 , ,,再加上对华封锁高端EUV装备 , ,,海内芯片在这条赛道上随处受限。。 。

韬定律另辟蹊径:放弃空间微缩 , ,,转向时间微缩 , ,,搭建晶体管-电路-芯片-系统四层全栈优化系统。。 。缩小晶体管不是目的 , ,,更高的算力密度和更短的信号撒播时间才是。。 。

在电路层 , ,,华为独创逻辑折叠手艺 , ,,把平铺的芯片电路像折纸一样立体半数 , ,,犹如《盗梦空间》里折叠的都会 , ,,线路长度缩短30%。。 。

在芯片层 , ,,华为举行软件、架构、芯片的三者协同 , ,,也就是凭证现实使命需求来调配芯片内部的资源 , ,,砍掉一切不须要的期待。。 。

在系统层 , ,,华为自研灵衢总线 , ,,统一系统内部的协议系统 , ,,解决盘算节点间的割裂问题 , ,,将系统通讯延迟从几十微秒降到约100纳秒 , ,,降低了时间延迟近500倍。。 。在灵衢总线之上 , ,,华为还发明了Hi-ONE光互连引擎 , ,,用光替换铜传输数据 , ,,单模????榇砀叽8Tb/s , ,,能让数万张GPU像一台机械一样协同事情。。 。

韬定律要想开枝散叶树大根深 , ,,还需要建设共享的供应链生态 , ,,在四层优化的系统中 , ,,每一层都能发动半导体工业链的再次重构。。 。从这个角度来说 , ,,提出韬定律无疑是一次原始立异。。 。

华为将在2026年秋季宣布麒麟2026手机芯片 , ,,靠韬定律+逻辑折叠手艺 , ,,将峰值主频提升到3.1GHz , ,,晶体管密度提升53.5%抵达每平方毫米2.38亿颗晶体管 , ,,在不依赖外洋先进光刻制程的条件下 , ,,综合水准对标行业3nm旗舰芯片!

华为测算 , ,,依托韬定律 , ,,2031年成熟制程芯片即可实现等效1.4nm先进制程水准 , ,,突破“先进芯片必需依赖EUV”的藩篱。。 。

中国的立异哲学

DeepSeek和华为韬定律 , ,,最大的相似之处不是详细手艺 , ,,而是与美国差别的立异哲学。。 。

从AI规模缩放和摩尔定律来看 , ,,美国科技追求系统产出 , ,,绝不在乎用了几多资源 , ,,很像西方古代的粗放农业模式——靠扩大耕作面积提高产出。。 。

中国科技则在追求系统产出/资源占用之比 , ,,像中国古代农业的精耕细作——优化堆肥、施肥、选种、育种、耕作、整地、除草、耘田、追肥、浇灌、收获的每个环节 , ,,增添土地肥力 , ,,增添庄稼的产量。。 。

DeepSeek和华为都从“最微观”的单位上改起。。 。DeepSeek刷新MoE算法 , ,,按需挪用少量参数;;华为用逻辑折叠缩短芯片内部电路节点之间的距离。。 。他们都在买通全链条所有环节统筹调配 , ,,统一通讯协议 , ,,优化信息转达 , ,,镌汰互联消耗 , ,,“逐一挖掘”每个部分的剩余性能 , ,,从“误差”里抠出“性价比” , ,,全力增添总产出。。 。

简而言之 , ,,无法在资源规模上取胜时 , ,,就用协同优化在系统效率上重构游戏规则。。 。

这可能就是中国科技破局的要害!

而协同优化的头脑源头 , ,,与钱学森首创的系统论很是靠近。。 。

钱学森以为 , ,,系统比零件更主要 , ,,整体最优优于局部最优 , ,,总体设计决议成败 , ,,重大系统依赖反馈和协同 , ,,现代国家竞争越来越是系统与系统之间的竞争。。 。

钱学森特殊强调 , ,,抓系统主要矛盾 , ,,而不是抓局部指标 , ,,就是从“极限突破”转向“协同突破”。。 。

钱学森在中国航天系统中实践了他的系统论头脑 , ,,好比专门认真协同优化的总体设计部制度 , ,,能将一项大型工程里的上万名工程师、数百家协作单位和供应商拧成一股绳攻坚克难!

直到今天 , ,,中国的种种大型项目里都能看到系统论的影子 , ,,并且这种头脑还被引入了国家治理系统之中 , ,,好比顶层设计和整体谋划的看法 , ,,统筹多工业生长结构、衔接中恒久生长目的的五年妄想。。 。这已成为东方差别于西方的典范特色。。 。

外国人总惊讶中国的恒久主义、战略远见和刷新魄力 , ,,现实上中国人都知道“不谋万世者 , ,,缺乏谋一时;;不谋全局者 , ,,缺乏谋一域” , ,,正因云云 , ,,我们才华协同起来下好“天下一盘棋”。。 。

中国立异哲学是中华文明孕育出的超等基因 , ,,让天下尖端科技博弈的要害 , ,,不再是简单指标的极限冲刺 , ,,而是协同优化的破局能力。。 。当西方还在沿用“粗放模式”疯狂卷资源时 , ,,华为与DeepSeek 已经用原始立异的累累硕果证实 , ,,中国不再简朴追赶 , ,,我们最先原始立异。。 。

 

文章点评

未盘问到任何数据!

揭晓谈论

◎接待加入讨论 , ,,请在这里揭晓您的看法、交流您的看法。。 。

最新文章

热门文章

随机推荐

【网站地图】