凯时AG

泉源:东航原董事长刘绍勇被提起公诉作者: 吴肇星:

国产通用大模子第一梯队 ,,,,,,来新人了???!

一张新面目 ,,,,,,就这样突入了国产通用大模子第一梯队。。

走的还不是行业主流的“堆参数”路径。。

这事放今天 ,,,,,,谁听了不想迅速围观一下??????

我也不破例 ,,,,,,并且我还顺便挖了一下这家公司这样做的原因(好奇.jpg)。。

效果你猜怎么着???谜底居然云云“直击灵魂”——再走古板老路 ,,,,,,你我的Token钱包是真扛不住了。。

△图片由AI天生

这事还得从已往几年行业默认的“堆参数、堆算力”玩法提及 ,,,,,,得益于“大力出事业”这条规则 ,,,,,,大模子确实变得越来越智慧 ,,,,,,但账单也越来越离谱。。

尤其进入推理时代、Agent时代后 ,,,,,,这一问题肉眼可见变得越发突出了:

为了让模子“想得更深” ,,,,,,行业主流做法是让它把思索链条逐Token睁开 ,,,,,,效果Token消耗越来越夸张。。

传导到行业加入者 ,,,,,,企业最先天天愁赚不到钱 ,,,,,,我们通俗人也日常陷入“Token不敷用、用不起”的焦虑。。

以是 ,,,,,,该怎么给各人精准止痛呢???

今天这位玩家 ,,,,,,港股AGI第一股云知声 ,,,,,,带着它的新一代基座模子U2 ,,,,,,来了。。

U2不卷参数 ,,,,,,卷“智能密度×Token价值”。。并且说是通用大模子 ,,,,,,但骨子里着实是个原生智能体模子。。

说白了 ,,,,,,U2的一切都是为了“让单位Token施展出最大智能”而设计的。。

你问效果怎样???数据很能说明问题:U2在多项要害评测上 ,,,,,,以极低的激活参数规模比肩甚至逾越体量大得多的敌手 ,,,,,,思索Token消耗量可镌汰约25% ,,,,,,在压缩思索Token消耗的同时 ,,,,,,推理本钱显著低于同尺寸规模巨细模子。。

能力不减、Token更少、本钱还打下来了 ,,,,,,U2究竟是怎么做到的???

U2有多能打???实测一下

怎么做到的先不谈 ,,,,,,咱先回覆一个问题:这瓜保真不???(潜台词≈U2真实有多能打)

谜底是 ,,,,,,确实有点工具。。和同类模子比 ,,,,,,U2最显着的差别有两个:

一是特殊醒目活 ,,,,,,IFBench指令遵照、Claw系列Agent评测、GDPval办公能力评测都打到了前排 ,,,,,,并且完成重大使命的交互轮次更少 ,,,,,,不会动不动卡壳往返折腾;;;;

二是“以小胜大” ,,,,,,GPQA硬核推理和长文本明确上 ,,,,,,仅凭极低激活参数 ,,,,,,打出了靠近甚至凌驾部分超大模子的效果。。

即是说 ,,,,,,又醒目活、又不靠烧算力 ,,,,,,这两件事U2同时做到了。。

好好好 ,,,,,,我已经忍不住要用它跑跑真实案例了。。

现在U2已正式上线云知声Token Hub ,,,,,,个人、开发者及组织均可体验。。它支持OpenClaw/Hermes等主流Agent脚手架 ,,,,,,可无缝对接现有开发流程 ,,,,,,适配本钱较低。。

既然U2善于开发 ,,,,,,一上来我就妄想给它“挖坑” ,,,,,,出一道开放性问题(doge)。。

提醒词大致为:做一个值得上Awwwards的前端demo ,,,,,,可自由选择创意主题 ,,,,,,单文件HTML、不必外部库。。

这道题没有标准谜底 ,,,,,,考的是模子在没有约束时能自动展示多高的上限。。

凭证老例 ,,,,,,弱模子一般会选择做通俗官网、卡片结构或按钮动画 ,,,,,,而强模子会自动往粒子宇宙、流体模拟、物理引擎这个偏向走。。

效果U2很快就交出了一个交互式粒子宇宙 ,,,,,,快要1000行代码 ,,,,,,没有引用任何外部依赖 ,,,,,,所有原生实现。。

视频地点:https://mp.weixin.qq.com/s/IISZprE3c_4w0y61y0EBLQ

翻开HTML ,,,,,,鼠标移动会扰动周围粒子的运动轨迹 ,,,,,,点击会触发吸引、倾轧、围绕三种模式的切换 ,,,,,,左上角面板还能实时显示目今粒子数目及运动状态。。

日常感伤一下 ,,,,,,以前考大模子 ,,,,,,顶多是让它在六边形里转小球。。现在倒好 ,,,,,,直接上这种生产力级的Vibe Coding了。。

而说到Vibe Coding ,,,,,,最近恰恰有个想法想实践一下:做一个12星座版的《TA究竟在想什么》应用。。

网上冲浪时经常刷到那种 ,,,,,,求网友资助剖析“crush究竟什么意思”的帖子 ,,,,,,脑瓜子一转 ,,,,,,商机这不就来了。。

于是我立马扔给U2一些模糊形貌 ,,,,,,焦点需求是能不可连系对方星座 ,,,,,,判断对方某些话或行动背后的真实意图。。

效果U2一口吻搞定了五大功效??? ,,,,,,挨个测试每项功效都能正常使用(谈天纪录为AI天生) ,,,,,,尤其较量惊喜的是它还想到了AI回复这一点 ,,,,,,好吧 ,,,,,,我认可AI你照旧在我之上。。

视频地点:https://mp.weixin.qq.com/s/IISZprE3c_4w0y61y0EBLQ

若是说上面这些还只是体现了U2的Agent开发能力 ,,,,,,那么最后这个则是真正磨练它的推理和研究深度——

我让U2对OPC(一人公司)赛道做一次全景式深度研究 ,,,,,,要求输出结构完整、有数据支持的可交互HTML报告。。

全程没给任何资料 ,,,,,,没有指定命据泉源 ,,,,,,就一句指令。。

没想到U2却交出了一份让人眼前一亮的报告:

视频地点:https://mp.weixin.qq.com/s/IISZprE3c_4w0y61y0EBLQ

左侧牢靠导航 ,,,,,,右侧内容区从工业概述、焦点数据、行业漫衍一起笼罩到政策解读和未来展望……页面底部显示数据均出自国家市场监视治理总局、中国OPC生长调研报告2026等果真数据。。

数据有来由 ,,,,,,判断有逻辑 ,,,,,,不是凑字数 ,,,,,,是真在做研究。。

三个案例跑完 ,,,,,,转头看会发明它们划分在验证U2的三条能力线:

粒子宇宙考Coding ,,,,,,没有脚手架也能交出生产级代码;;;;星座应用考Agent ,,,,,,需求模糊、???榉痹 ,,,,,,照样没卡壳没返工;;;;OPC报告考Reasoning ,,,,,,零资料输入也能把研究做出来。。

更要害的是 ,,,,,,三个使命U2还都没靠堆Token换效果。。

嗯???这是咋回事???U2究竟是怎么做到又好又省的???

U2为什么能做到

转了一圈 ,,,,,,我找到的谜底是:

从理念到工程设计 ,,,,,,U2和已往盛行的那套全都纷歧样。。

U2的设计理念 ,,,,,,着实就是开头提到的“智能密度×Token价值”。。

听起来有点笼统 ,,,,,,无妨连系云知声首创人黄伟的话来明确:

用更高效的资源投入 ,,,,,,用模子架构工程能力方面的优化 ,,,,,,打造出能知足绝大大都场景的智能水平 ,,,,,,这就是智能密度。。至于何谓“高价值Token” ,,,,,,则是能够直接转化为商业收入、降低运营本钱、规避重大风险或提升决议质量的Token。。

换句话说 ,,,,,,每一分算力、每一个Token ,,,,,,都得花在刀刃上。。两个乘数同时优化 ,,,,,,缺一不可。。

而落到工程上 ,,,,,,U2则针对两大行业焦点痛点精准挥刀。。

怎么不卷参数 ,,,,,,以小胜大???把模子性能提起来。。怎么镌汰Token消耗???把模子使用本钱降下去。。

先说性能 ,,,,,,U2主要从数据和架构层面举行了优化。。

古板模子里保存大宗“光占参数不着力”的无效数据 ,,,,,,于是U2选择做高知识密度精筛——

把重复、低质、容易诱发幻觉的数据大宗过滤掉 ,,,,,,只留真正有知识含量的部分。。

这样一来 ,,,,,,模子单位参数的有用知识密度显着提升。。

控制好输入端之后 ,,,,,,怎么继续包管模子不说空话呢???

对此 ,,,,,,他们在表达层面又做了语义Token压缩优化 ,,,,,,通过优化分词与表征 ,,,,,,让每个Token只管承载更多有用信息 ,,,,,,相当于同样一句话 ,,,,,,用更少Token说清晰。。

双方都控制好 ,,,,,,最后再给“幻觉”加一道包管——设置一套知识点级校验与自反馈机制 ,,,,,,一连纠偏、自动抑制幻觉。。

说白了 ,,,,,,整个数据层面就是往“用更少Token办更多事”上靠。。

△图片由AI天生

架构上 ,,,,,,U2焦点是希罕MoE(混淆专家)结构 ,,,,,,叠加希罕知识编码和知识蒸馏。。

MoE我知道 ,,,,,,实质就是“按需激活” ,,,,,,为啥这里又多了“希罕”二字???

一查才知道 ,,,,,,通俗MoE虽然也是按需挪用 ,,,,,,但若是专家自己依然很臃肿 ,,,,,,激活数目一多 ,,,,,,算力照样压不下来。。

而希罕MoE主打一个“能省则省”——能用一个专家解决的 ,,,,,,绝不叫两个;;;;能用小专家解决的 ,,,,,,绝不叫大专家。。

于是 ,,,,,,U2在MoE之前加了一道“希罕知识编码+知识蒸馏”的程序 ,,,,,,把每个专家的知识做一遍精炼提纯 ,,,,,,让每个专家变得更精悍。。

而数据和架构的威力一叠加 ,,,,,,U2便依附2660亿参数 ,,,,,,抵达了1.2万亿参数模子的性能 ,,,,,,参数效率靠近后者的5倍。。

至于Token该怎么省 ,,,,,,U2选择从推理环节动刀。。

为了让模子想得更深 ,,,,,,主流做法是把完整头脑链逐Token睁开输出——效果确实好 ,,,,,,但Token也烧得飞快 ,,,,,,重大使命里真正贵的往往不是谜底 ,,,,,,而是那一大堆思索历程。。

而U2在实践中发明 ,,,,,,不说出思索历程 ,,,,,,谜底一样靠得住。。详细他们干了两件事:

一是精简推理路径 ,,,,,,直接砍掉无效方法和兜圈子的冗余推导;;;;二是类比人脑解题方式引入隐式思索机制 ,,,,,,在隐藏层先把解题偏向想清晰 ,,,,,,再进入显式推理的细化验证 ,,,,,,大宗中心历程基础不需要睁开成Token输出。。

以是说 ,,,,,,古板模子是边想边说 ,,,,,,而U2更像先想明确、再挑重点说。。

△图片由AI天生

靠着这一设计 ,,,,,,U2在保存多路径探索与后续可验证性的同时 ,,,,,,可将思索Token消耗量镌汰约25%。。

25%什么看法???放在企业级长链路使命里 ,,,,,,这个数字带来的本钱差别 ,,,,,,只能说懂的都懂了。。

而这还没完 ,,,,,,U2还把原生Agent能力和Harness Engineering放进了统一个训练闭环。。

Harness会凭证模子特点一连优化 ,,,,,,模子再使用Harness返回的真实使命数据 ,,,,,,继续强化多步妄想、工具挪用和历程纠错能力。。双方相互喂数据、相互进化。。

效果就是 ,,,,,,U2的Agent能力不是后天外挂的 ,,,,,,而是原生长出来的。。

而“原生”意味着 ,,,,,,模子完成重大使命时需要的交互轮次更少、上下文更短 ,,,,,,单次营业Token本钱也会进一步下降。。

到这里你发明没 ,,,,,,在U2身上 ,,,,,,小参数、强能力、少Token并非取舍 ,,,,,,而是被同时设计进去的。。

从理念到工程设计 ,,,,,,U2每一层都在往统一个偏向使劲:

让智能更密、让Token更值。。

为什么是云知声

好 ,,,,,,现在我已经知道有U2这样一个模子了 ,,,,,,但问题是:

为什么在各人普遍以为大模子竞争名堂已经收敛之时 ,,,,,,云知声还要往里闯???并且还真让它闯进去了???

一切可以追溯到上个月 ,,,,,,晚点LatePost对云知声首创人黄伟的采访。。

黄伟的判断很直接:2023到2025年是大模子的热身赛 ,,,,,,2026年正赛才刚最先。。

乍一听有点像时势话 ,,,,,,但仔细想想还真不是。。

热身赛比的是参数、算力和资源投入 ,,,,,,实质上是一场资源消耗战。。而现在 ,,,,,,AI正从“天生式”迈入“生产力”时代——模子要真正下场干活了 ,,,,,,每一个Token都得换回真实的营业价值。。

以是 ,,,,,,虽然走的照旧通用大模子这条路 ,,,,,,但已经不是统一场角逐了。。已往比谁投入更多资源 ,,,,,,现在比谁能创立更多价值 ,,,,,,评分标准已经悄悄改变。。

说白了 ,,,,,,以前那套竞争名堂或许已经收敛 ,,,,,,但新的竞争名堂 ,,,,,,才刚刚睁开。。

这也诠释了为啥云知声第一代基;;;;菇小吧胶! ,,,,,,现在却酿成了“U2” ,,,,,,它代表的正是这种AI范式的转变。。

△图片由AI天生

而在这套新的竞争系统下 ,,,,,,云知声已往十几年攒下的“家底”最先施展作用了。。

那些一经看起来不敷性感、甚至有些“慢”的积累 ,,,,,,现在反而成了它攻击第一梯队的主要筹码。。

云知声2012年依附语音识别起身 ,,,,,,去年刚完成港股上市 ,,,,,,被外界普遍视为“港股AGI第一股”。。

许多人一看它名字里有“声” ,,,,,,就下意识以为这是一家语音公司 ,,,,,,但这着实是一种误解。。

准确翻开方式是 ,,,,,,三个字看全——“云”是智能的载体 ,,,,,,“知”是认知的焦点 ,,,,,,“声”只是进入这个天下的第一扇门。。

在黄伟看来 ,,,,,,他们听的历来不是声音 ,,,,,,而是声音背后的意识。。

何谓“声音背后的意识”???焦点有三层 ,,,,,,换成示意图明确如下:

△图片由AI天生

看到没 ,,,,,,为了搞懂“声音背后的意识” ,,,,,,云知声着实一起都在升级自己的能力界线。。

最早做语音识别 ,,,,,,解决“听懂”的问题;;;;厥后做智能交互 ,,,,,,解决“明确意图”的问题;;;;再厥后 ,,,,,,当目的酿成明确情绪、场景和恒久需求时 ,,,,,,单点手艺已经不敷用了 ,,,,,,背后需要一个能够推理、妄想和行动的智能大脑。。

以是从某种意义上说 ,,,,,,云知声并不是突然转型做大模子 ,,,,,,而是在追逐“让机械真正明确人”这件事的历程中 ,,,,,,一步步走到了大模子这里。。

这也诠释了它今天为什么把自己定位为:原生智能体基座大模子公司。。

不是赶风口 ,,,,,,是这条线走到现在 ,,,,,,自然走到了这个位置。。

而在Agent时代 ,,,,,,这段积累尤其值钱。。

就这么说吧 ,,,,,,现在各人熟知的大模子玩家 ,,,,,,险些都是2023年前后麋集冒出来的新面目 ,,,,,,但云知声不是。。

早在AI 1.0时代 ,,,,,,它就已经在做真实场景落地了。。

多年来 ,,,,,,它一直坚持“强基模+深应用”的蹊径:一边自主研发底层模子能力 ,,,,,,一边扎根工业场景做深度落地。。

围绕智慧医疗和智慧生涯两条营业主线 ,,,,,,它积累了大宗真实数据、真实需求 ,,,,,,以及真实反馈。。

而这些 ,,,,,,正是大模子时代最稀缺、也最值钱的工具。。

更要害的是 ,,,,,,这种来自真实场景的压力 ,,,,,,还倒逼出了云知声自己奇异的一套要领论:不追求参数规模 ,,,,,,追求更高的智能密度、更低的推理本钱、更强的落地能力。。

说到这里 ,,,,,,有个细节很值得一提。。众所周知 ,,,,,,老黄喜欢说token efficiency ,,,,,,“同样100万token ,,,,,,我用更少的电费、更少的算力把它生产出来” ,,,,,,但这只是生产端的看法。。

而云知声一步到位 ,,,,,,想的是“这100万token生产出来之后 ,,,,,,它究竟值几多钱”。。效率再高 ,,,,,,若是全是空话 ,,,,,,商业价值也是零。。

围绕这个逻辑 ,,,,,,云知声搭了一套完整的系统:底层是U2这样的基座大模子 ,,,,,,中心是兽牙智能体平台 ,,,,,,上层一端毗连医疗、医保、交通、客服等工业场景 ,,,,,,另一端通过MaaS和生态平台触达开发者与个人用户。。

模子创立价值 ,,,,,,价值爆发Token消耗 ,,,,,,Token消耗转化为收入 ,,,,,,属于云知声的“Token经济学”就此闭环跑通了。。

而最新的数据 ,,,,,,已经最先验证这套逻辑。。

已往几年云知声发声未几 ,,,,,,一部分原因是港股上市静默期的客观限制。。

但现在静默期竣事了 ,,,,,,财报也摆在那里:不到500人的团队 ,,,,,,年营收凌驾10亿元 ,,,,,,大模子相关收入突破6.1亿元 ,,,,,,同比增添凌驾10倍。。

更直接的信号来自Token营业 ,,,,,,量子位探询到 ,,,,,,云知声今年5月Token挪用收入ARR环比增添了600% ,,,,,,预计6月仍将坚持高速增添。。

这意味着 ,,,,,,云知声的收入已经和客户创立的AI价值直接挂钩了 ,,,,,,客户用得越多、价值越大 ,,,,,,收入的天花板也随着翻开。。

“智能密度×Token价值”这套逻辑 ,,,,,,不再只是理念 ,,,,,,而是已经最先在财报上展现。。

以是回过头看U2 ,,,,,,外貌上 ,,,,,,它以1/10的Token本钱重构了重大使命的本钱结构 ,,,,,,让许多已往算不过账的AI场景 ,,,,,,第一次具备了大规模安排的可能。。

实质上 ,,,,,,它验证的是“智能密度”这条蹊径自己的可行性:性能不是堆出来的 ,,,,,,本钱不是靠降质量省下来的 ,,,,,,两件事可以同时爆发。。

当每一个Token都能创立更多价值时 ,,,,,,显而易见 ,,,,,,“更大”便不再是唯一谜底——

行业的评价坐标 ,,,,,,将从“谁的模子更大” ,,,,,,逐渐转向“谁的模子更值”。。

而U2 ,,,,,,正是这一转变的第一块试金石。。

在线体验:https://maas.unisound.com/models/u2

@黄嘉惠:黄色录像一级 ,,,,,,黑龙江省农业农村厅原厅长王金会被查
@张淑琴:“铁杆友谊”彰显中外洋交的鲜明底色
@苏碧绮:“格斗女中医”石铭斩获UFC生涯首胜

热门排行

【网站地图】