凯时AG

离别“重算力、轻效益”误区:光合组织“Token谱系”求解算力投入产出失衡

作者:陈怡婷
宣布时间:2026-06-15 10:27:59
阅读量:47

离别“重算力、轻效益”误区:光合组织“Token谱系”求解算力投入产出失衡

泉源:环球网

前言:1986年 ,,,国家“863妄想”启动 ,,,中国信息手艺自主立异的征程由此滥觞。。 。。。。四十年已往 ,,,国产算力从无到有、从追赶到并跑 ,,,走过了引进消化、自主研制、生态构建的漫长蹊径。。 。。。。早期 ,,,“缺芯少魂”的逆境曾让一代科研事情者负重前行;;;;;;现在 ,,,国产CPU、GPU、AI芯片已在数据中心、超等盘算、要害行业落地生根 ,,,“可用”问题起源解决。。 。。。。

然而 ,,,当大模子与智能体掀起AI工业化浪潮 ,,,一个新的命题浮出水面:算力有了 ,,,但算力的“效益”怎样释放?????企业投入巨额资金采购算力 ,,,却经常陷入“Token焦虑”——适配本钱高、调理效率低、数据风险大 ,,,投入与产出失衡。。 。。。。行业亟需从“重硬件、轻协同”的旧模式中突围。。 。。。。

本次《863妄想40年》系列采访 ,,,我们将关注国产算力怎样追求算力投入产出的解决方案。。 。。。。

【环球网科技报道 记者 李文瑶】5月28日 ,,,2026天下智能工业博览会(智博会)在天津开幕。。 。。。。当大模子与行业智能体从“炫技”走向规;;;;;;涞 ,,,工业界的焦虑点也已转移:从“算力够不敷大” ,,,转向了“算力效益够不敷高”。。 。。。。Token——这一承载AI交互与推理的基本单位 ,,,成为了权衡算力价值的新标尺。。 。。。。

然而 ,,,算力架构的碎片化、生态的关闭割裂 ,,,导致Token生产不稳固、调理受阻、投入产出比失衡 ,,,成为困扰企业的普遍痛点。。 。。。。在本届智博会上 ,,,光合组织携其“开放盘算Token谱系”亮相 ,,,联合超6000家生态同伴回覆一个焦点命题:怎样解放Token生产力 ,,,让每一分算力投入都能转化为可见的工业价值?????

直击痛点:从“算力焦虑”到“Token效益”的认知升维

走进天津国家会展中心N26-01展位 ,,,光合生态同伴的联合展示区前人头攒动。。 。。。。与往年纯粹比拼芯片峰值算力差别 ,,,今年展区的要害词酿成了“效率”与“产出”。。 。。。。

“已往各人问‘你的芯片算力是几多T’ ,,,现在问‘跑一个Token的本钱是几多?????延迟有多低?????”展台事情职员向记者先容。。 。。。。这种提问方式的转变 ,,,折射出行业认知的根天性转变。。 。。。。

在采访中 ,,,海光信息总裁助理兼智能盘算产品部总司理杜夏威直言不讳地指出 ,,,行业正陷入一种“Token焦虑”。。 。。。。他诠释道:“Token焦虑未必是坏事情。。 。。。。若是你对Token没有感知 ,,,自然不会焦虑;;;;;;现在各人都在焦虑 ,,,恰恰说明工业在快速流动。。 。。。。”他以为 ,,,这种焦虑具有双重性:一方面 ,,,企业担心国产算力能否承接爆发式增添的需求;;;;;;另一方面 ,,,更焦虑于怎样将Token与自己原有的生产型营业深度融合 ,,,阻止算力资源的闲置与铺张。。 。。。。

海光信息总裁助理 ,,,立异产品线总司理李成则从手艺演进角度增补了一个要害趋势:“已往训练阶段以GPU为主 ,,,CPU的作用被低估。。 。。。。但随着Open Claw等智能体的生长 ,,,我们发明CPU的处理时间可能占到整个Agent使命处理时间的90%。。 。。。。”他引述行业研究称 ,,,在AI推理与智能体交互中 ,,,CPU与GPU的比例正从已往的1:4向1:1甚至更高过渡。。 。。。。“GPU认真跑得快 ,,,CPU认真跑得稳、跑得久。。 。。。。智能体不是一问一答 ,,,而是长时间、多使命、随机交互的系统工程 ,,,这恰恰是通用CPU的强项。。 。。。。”

这一判断直接挑战了“唯GPU论”的行业惯性。。 。。。。杜夏威进一步强调:“算力指标是芯片物理能力的‘天花板’ ,,,我们依然要回归客观维度。。 。。。。但围绕算力指标之上 ,,,更要看怎样快捷、高效地将算力转化成Token。。 。。。。算力指标权衡的是芯片自身能力 ,,,而Token吞吐力权衡的是把算力营业化的能力。。 。。。。”

这诠释了为何光合组织在本届智博会上的焦点行动是宣布“开放盘算Token谱系”。。 。。。。该谱系并非简单手艺 ,,,而是一套从硬件、软件到应用的三层协同架构 ,,,旨在解决算力工业恒久保存的三大焦点问题:算力标准统一、调理互通与应用赋能。。 。。。。

生态破局:三层协同解构“Token谱系”价值逻辑

在古板模式下 ,,,算力供应犹如“九龙治水”——芯片指令集各异、开发情形不兼容、集群调理效率低下。。 。。。。企业往往采购了腾贵的服务器 ,,,却因适配周期长、跨平台迁徙难 ,,,导致大宗算力在“客栈”和“机房”中甜睡。。 。。。。

光合组织的“Token谱系”试图通过全链协同重构这一逻辑。。 。。。。

首先是在硬件筑基曾 ,,,统一算力标准。。 。。。。谱系的底座是国产芯片。。 。。。。李成向记者阐释了海光的云边端全场景结构逻辑:“凯时AG焦点逻辑是高清静、高通用、高性能。。 。。。。从云端的海光CPU高焦点数、高负载能力 ,,,到边端的轻量服务器、嵌入式低功耗产品 ,,,再到终端的AIPC与智能体专用芯片——CPU、GPU、NPU三位一体 ,,,客户可以即开即用 ,,,无需重复适配。。 。。。。”

其中 ,,,面向工控和边端场景的嵌入式芯片尤其值得关注。。 。。。。光合组织嵌入式产品专家张考华在采访中强调:“海光推出的C86架构嵌入式芯片并非‘降级品’ ,,,而是将高端服务器芯片的手艺下移 ,,,并针对宽温、卑劣情形、内生清静等工业特征做了专门设计。。 。。。。”他提到 ,,,已往国产芯片常被贴上“能用但欠好用”的标签 ,,,但这更多是一种头脑惯性。。 。。。。“这款芯片已经在海内多个案例中获得用户正向反馈 ,,,从市场磨练来看 ,,,我们很是有信心。。 。。。。”

第二个层面是软件提效 ,,,实现调理互通。。 。。。。仅仅有芯片是不敷的。。 。。。。在光合展区 ,,,记者看到了基于自研HSL开放总线协议的异构互联架构。。 。。。。这一架构允许差别厂商的算力芯片在系统层面高效协同 ,,,而非简朴堆砌。。 。。。。

针对记者提出的“万卡集群中怎样解决堆得越多消耗越大”的问题 ,,,李成给出了明确的谜底:“除了CPU和DCU的双芯支持外 ,,,我们还提供类似NVLink/NVSwitch的互联芯片 ,,,别的 ,,,海光在互联互通协议上做了大宗事情。。 。。。。从小集群到超节点网络 ,,,我们能支持凌驾万卡集群的AI互联系统 ,,,包括RDMA、一级/二级叶脊架构的高效协同。。 。。。。这是我们有别于其他竞争厂商的一个较量大的优势。。 。。。。”

杜夏威则从调理角度增补:“有些算力实时性要求高 ,,,不适合都往云端传;;;;;;有些则需要举行大规模训练。。 。。。。通过开放调理架构和统一的算力标准 ,,,我们可以实现Token的分级引流——就近的边沿侧盘算与集中的数据中心盘算形成协同 ,,,极大镌汰数据传输压力与资源闲置。。 。。。。”

最后即是应用层面的增值 ,,,聚焦产值转化。。 。。。。这是“Token谱系”的最终落脚点。。 。。。。展区现场 ,,,23大领域的落地效果被集中展示:从质料盘算、生物医药到气象仿真、智能制造 ,,,300余项重点应用已完成深度适配。。 。。。。

“Token能不可被用户的营业侧真正使用起来 ,,,是凯时AG新权衡指标。。 。。。。”杜夏威在访谈中重复强调这一看法。。 。。。。他分享了一个视角的视察:“已往各人关注模子训练的效率 ,,,但未来 ,,,模子效率并不可完全等价于Token效率。。 。。。。即便转化成了Token ,,,在营业中仍有大宗优化空间 ,,,我们要协助用户完成场景转化 ,,,而不是仅仅让模子跑起来。。 。。。。”

生态协同如作甚“应用层”解渴?????

理论的弘大叙事 ,,,最终要落到详细工程师的键盘声和产线的数据流中。。 。。。。在智博会现场 ,,,记者采访了多位光合组织的生态同伴 ,,,听到了几个关于“Token提质增效”的真实故事。。 。。。。

麒麟信安副总司理孙玉峰向记者分享了一组直观的数字转变。。 。。。。“以前麒麟信安做方案适配 ,,,光调试就要2到3周。。 。。。。”孙玉峰坦言 ,,,在古板的算力供应模式下 ,,,芯片、操作系统、中心调理、应用之间各自为政 ,,,每接入一个新场景 ,,,都像一次“拼图游戏” ,,,大宗时间泯灭在底层兼容性验证上。。 。。。。

转变始于光合组织“开放盘算Token谱系”的落地。。 。。。。孙玉峰先容 ,,,该谱系将中心调理、操作系统、项目应用拉通到一条流水线上 ,,,“我们现在从芯片到营业上线 ,,,压缩到1周以内。。 。。。。Token从爆发到交付的时间少了 ,,,效益自然就出来了。。 。。。。”

他用三个词概括光合生态的协同感:无感、高效、增值。。 。。。。“真正的协同感 ,,,自己就是要各人无感。。 。。。。”孙玉峰诠释道 ,,,麒麟信清静面兼容海光的国产CPU ,,,并基于海内终端构建全栈、全链设计 ,,,“从上层应用基本感知不到切换 ,,,这才是底层生态成熟的标记。。 。。。。”

高效则是极致协同下的必定效果。。 。。。。“当软硬件全栈拧成一股绳 ,,,跨平台调理消耗会显著下降。。 。。。。”这种高效不但体现在项目周期上 ,,,更直接反映在算力资源的使用率上。。 。。。。

而“增值”在单位算力上体现得尤为显着。。 。。。。孙玉峰体现:“凭证营业场景分配 ,,,统一个Token在光合谱系中的营业价值更高。。 。。。。这也决议了许多AI用户的选择站位——他们不再只看单点性能 ,,,而是看整个生态能带来的产出。。 。。。。”

云宏信息华北区总司理葛玉龙用一个形象的比喻 ,,,诠释了光合生态怎样解决算力碎片化难题。。 。。。。“我们做虚拟化 ,,,实质上是差别芯片之间的‘调理翻译官’。。 。。。。”葛玉龙说 ,,,“若是底层芯片保存手艺壁垒 ,,,从A芯片到B芯片 ,,,Token消耗可能掉到30%。。 。。。。”这种消耗意味着企业每花1元钱买算力 ,,,只有7毛钱真正爆发了营业价值。。 。。。。

光合组织的开放盘算Token谱系 ,,,则通过买通多芯调理的底层 ,,,让虚拟化平台可以在差别芯片之间无缝切换。。 。。。。“不设卡、不落伍、有议价”——葛玉龙用三个要害词形貌这种协同感。。 。。。。

谈及Token效益 ,,,葛玉龙的看法与孙玉峰不谋而合。。 。。。。他指出:“已往各人提算力规模 ,,,但Token的效益并没有随着算力线性增添。。 。。。。国产算力生态的焦点价值不是群集硬件 ,,,而是做效率的乘法。。 。。。。就像光合组织用开放、协同的方式 ,,,把国产软硬件全栈拉通成一个谱系 ,,,让每一个Token从生产到变现路径更短、消耗更小、价值更高。。 。。。。这是Token效益提升须要的一环。。 。。。。”

在采访历程中 ,,,一个看法被重复提及:不可由于Token热 ,,,就完全否认基础算力指标的主要性。。 。。。。这意味着 ,,,工业界正在走出“重算力、轻效益”的误区。。 。。。。纯粹的峰值算力堆砌 ,,,若是不可转化为营业侧流通的对话体验或精准的推理效果 ,,,那么关于企业来说就是负资产。。 。。。。光合组织提出的“开放盘算Token谱系” ,,,实质上是一套价值分配与转化机制。。 。。。。它试图通过硬件、软件、应用的深度联动 ,,,让算力提供方不再只卖盒子 ,,,而是加入价值分成;;;;;;让应用方不再盲目采购 ,,,而是按Token效能付费。。 。。。。

从“可用”到“高效” ,,,算力基建进入下半场

智博会时代 ,,,光合组织与众智FlagOS、中科曙光、智源研究院、天津大学、中国移动天津公司等十余家产学研单位签约 ,,,共建“算力芯片+大模子+工业生态”全链立异平台。。 。。。。同时 ,,,天津市算电协同工业同盟建设 ,,,最先从能源侧解决算力本钱的深层问题。。 。。。。

这些行动释放出明确信号:国产算力基建正从早期的“解决有无”、“买通断点” ,,,迈向“极致优化”、“效益优先”的新阶段。。 。。。。

“我们只是其中的一分子。。 。。。。”杜夏威在采访中谦逊地体现。。 。。。。但他同时强调 ,,,市场的活跃与利润的增添是工业成熟的必定历程。。 。。。。“快速增添意味着市场在活跃 ,,,Token与工业的集成尚有许多事情要做 ,,,但这正是凯时AG时机。。 。。。。”

李成则给出了一个总结:“海光CPU在算力底座中肩负三个地基作用——承接生态、提供高速互联协议、包管内生清静。。 。。。;;;;;;〔焕 ,,,地动山摇。。 。。。。这是未来AI生长的最大基础 ,,,也是我们生长的底气所在。。 。。。。”

据相识 ,,,以开放盘算Token谱系为焦点 ,,,光合组织正一连拓睁开放生态界线、深化工业协同 ,,,系统性破解Token焦虑 ,,,推动国产算力迈向更高质量、更高效能的新阶段。。 。。。。

 

文章点评

未盘问到任何数据!

揭晓谈论

◎接待加入讨论 ,,,请在这里揭晓您的看法、交流您的看法。。 。。。。

最新文章

热门文章

随机推荐

【网站地图】