凯时AG

国产通用大模子第一梯队，，，，，来新人了？？！

作者：袁馨仁

宣布时间：2026-06-18 08:08:31

阅读量：9461

国产通用大模子第一梯队，，，，，来新人了？？！

一张新面目，，，，，就这样突入了国产通用大模子第一梯队。。。。。。

走的还不是行业主流的“堆参数”路径。。。。。。

这事放今天，，，，，谁听了不想迅速围观一下？？？？

我也不破例，，，，，并且我还顺便挖了一下这家公司这样做的原因（好奇.jpg）。。。。。。

效果你猜怎么着？？谜底居然云云“直击灵魂”——再走古板老路，，，，，你我的Token钱包是真扛不住了。。。。。。

△图片由AI天生

这事还得从已往几年行业默认的“堆参数、堆算力”玩法提及，，，，，得益于“大力出事业”这条规则，，，，，大模子确实变得越来越智慧，，，，，但账单也越来越离谱。。。。。。

尤其进入推理时代、Agent时代后，，，，，这一问题肉眼可见变得越发突出了：

为了让模子“想得更深”，，，，，行业主流做法是让它把思索链条逐Token睁开，，，，，效果Token消耗越来越夸张。。。。。。

传导到行业加入者，，，，，企业最先天天愁赚不到钱，，，，，我们通俗人也日常陷入“Token不敷用、用不起”的焦虑。。。。。。

以是，，，，，该怎么给各人精准止痛呢？？

今天这位玩家，，，，，港股AGI第一股云知声，，，，，带着它的新一代基座模子U2，，，，，来了。。。。。。

U2不卷参数，，，，，卷“智能密度×Token价值”。。。。。。并且说是通用大模子，，，，，但骨子里着实是个原生智能体模子。。。。。。

说白了，，，，，U2的一切都是为了“让单位Token施展出最大智能”而设计的。。。。。。

你问效果怎样？？数据很能说明问题：U2在多项要害评测上，，，，，以极低的激活参数规模比肩甚至逾越体量大得多的敌手，，，，，思索Token消耗量可镌汰约25%，，，，，在压缩思索Token消耗的同时，，，，，推理本钱显著低于同尺寸规模巨细模子。。。。。。

能力不减、Token更少、本钱还打下来了，，，，，U2究竟是怎么做到的？？

U2有多能打？？实测一下

怎么做到的先不谈，，，，，咱先回覆一个问题：这瓜保真不？？（潜台词≈U2真实有多能打）

谜底是，，，，，确实有点工具。。。。。。和同类模子比，，，，，U2最显着的差别有两个：

一是特殊醒目活，，，，，IFBench指令遵照、Claw系列Agent评测、GDPval办公能力评测都打到了前排，，，，，并且完成重大使命的交互轮次更少，，，，，不会动不动卡壳往返折腾；；

二是“以小胜大”，，，，，GPQA硬核推理和长文本明确上，，，，，仅凭极低激活参数，，，，，打出了靠近甚至凌驾部分超大模子的效果。。。。。。

即是说，，，，，又醒目活、又不靠烧算力，，，，，这两件事U2同时做到了。。。。。。

好好好，，，，，我已经忍不住要用它跑跑真实案例了。。。。。。

现在U2已正式上线云知声Token Hub，，，，，个人、开发者及组织均可体验。。。。。。它支持OpenClaw/Hermes等主流Agent脚手架，，，，，可无缝对接现有开发流程，，，，，适配本钱较低。。。。。。

既然U2善于开发，，，，，一上来我就妄想给它“挖坑”，，，，，出一道开放性问题（doge）。。。。。。

提醒词大致为：做一个值得上Awwwards的前端demo，，，，，可自由选择创意主题，，，，，单文件HTML、不必外部库。。。。。。

这道题没有标准谜底，，，，，考的是模子在没有约束时能自动展示多高的上限。。。。。。

凭证老例，，，，，弱模子一般会选择做通俗官网、卡片结构或按钮动画，，，，，而强模子会自动往粒子宇宙、流体模拟、物理引擎这个偏向走。。。。。。

效果U2很快就交出了一个交互式粒子宇宙，，，，，快要1000行代码，，，，，没有引用任何外部依赖，，，，，所有原生实现。。。。。。

视频地点：https://mp.weixin.qq.com/s/IISZprE3c_4w0y61y0EBLQ

翻开HTML，，，，，鼠标移动会扰动周围粒子的运动轨迹，，，，，点击会触发吸引、倾轧、围绕三种模式的切换，，，，，左上角面板还能实时显示目今粒子数目及运动状态。。。。。。

日常感伤一下，，，，，以前考大模子，，，，，顶多是让它在六边形里转小球。。。。。。现在倒好，，，，，直接上这种生产力级的Vibe Coding了。。。。。。

而说到Vibe Coding，，，，，最近恰恰有个想法想实践一下：做一个12星座版的《TA究竟在想什么》应用。。。。。。

网上冲浪时经常刷到那种，，，，，求网友资助剖析“crush究竟什么意思”的帖子，，，，，脑瓜子一转，，，，，商机这不就来了。。。。。。

于是我立马扔给U2一些模糊形貌，，，，，焦点需求是能不可连系对方星座，，，，，判断对方某些话或行动背后的真实意图。。。。。。

效果U2一口吻搞定了五大功效？？，，，，，挨个测试每项功效都能正常使用（谈天纪录为AI天生），，，，，尤其较量惊喜的是它还想到了AI回复这一点，，，，，好吧，，，，，我认可AI你照旧在我之上。。。。。。

视频地点：https://mp.weixin.qq.com/s/IISZprE3c_4w0y61y0EBLQ

若是说上面这些还只是体现了U2的Agent开发能力，，，，，那么最后这个则是真正磨练它的推理和研究深度——

我让U2对OPC（一人公司）赛道做一次全景式深度研究，，，，，要求输出结构完整、有数据支持的可交互HTML报告。。。。。。

全程没给任何资料，，，，，没有指定命据泉源，，，，，就一句指令。。。。。。

没想到U2却交出了一份让人眼前一亮的报告：

视频地点：https://mp.weixin.qq.com/s/IISZprE3c_4w0y61y0EBLQ

左侧牢靠导航，，，，，右侧内容区从工业概述、焦点数据、行业漫衍一起笼罩到政策解读和未来展望……页面底部显示数据均出自国家市场监视治理总局、中国OPC生长调研报告2026等果真数据。。。。。。

数据有来由，，，，，判断有逻辑，，，，，不是凑字数，，，，，是真在做研究。。。。。。

三个案例跑完，，，，，转头看会发明它们划分在验证U2的三条能力线：

粒子宇宙考Coding，，，，，没有脚手架也能交出生产级代码；；星座应用考Agent，，，，，需求模糊、？？榉痹，，，，，照样没卡壳没返工；；OPC报告考Reasoning，，，，，零资料输入也能把研究做出来。。。。。。

更要害的是，，，，，三个使命U2还都没靠堆Token换效果。。。。。。

嗯？？这是咋回事？？U2究竟是怎么做到又好又省的？？

U2为什么能做到

转了一圈，，，，，我找到的谜底是：

从理念到工程设计，，，，，U2和已往盛行的那套全都纷歧样。。。。。。

U2的设计理念，，，，，着实就是开头提到的“智能密度×Token价值”。。。。。。

听起来有点笼统，，，，，无妨连系云知声首创人黄伟的话来明确：

用更高效的资源投入，，，，，用模子架构工程能力方面的优化，，，，，打造出能知足绝大大都场景的智能水平，，，，，这就是智能密度。。。。。。至于何谓“高价值Token” ，，，，，则是能够直接转化为商业收入、降低运营本钱、规避重大风险或提升决议质量的Token。。。。。。

换句话说，，，，，每一分算力、每一个Token，，，，，都得花在刀刃上。。。。。。两个乘数同时优化，，，，，缺一不可。。。。。。

而落到工程上，，，，，U2则针对两大行业焦点痛点精准挥刀。。。。。。

怎么不卷参数，，，，，以小胜大？？把模子性能提起来。。。。。。怎么镌汰Token消耗？？把模子使用本钱降下去。。。。。。

先说性能，，，，，U2主要从数据和架构层面举行了优化。。。。。。

古板模子里保存大宗“光占参数不着力”的无效数据，，，，，于是U2选择做高知识密度精筛——

把重复、低质、容易诱发幻觉的数据大宗过滤掉，，，，，只留真正有知识含量的部分。。。。。。

这样一来，，，，，模子单位参数的有用知识密度显着提升。。。。。。

控制好输入端之后，，，，，怎么继续包管模子不说空话呢？？

对此，，，，，他们在表达层面又做了语义Token压缩优化，，，，，通过优化分词与表征，，，，，让每个Token只管承载更多有用信息，，，，，相当于同样一句话，，，，，用更少Token说清晰。。。。。。

双方都控制好，，，，，最后再给“幻觉”加一道包管——设置一套知识点级校验与自反馈机制，，，，，一连纠偏、自动抑制幻觉。。。。。。

说白了，，，，，整个数据层面就是往“用更少Token办更多事”上靠。。。。。。

△图片由AI天生

架构上，，，，，U2焦点是希罕MoE（混淆专家）结构，，，，，叠加希罕知识编码和知识蒸馏。。。。。。

MoE我知道，，，，，实质就是“按需激活”，，，，，为啥这里又多了“希罕”二字？？

一查才知道，，，，，通俗MoE虽然也是按需挪用，，，，，但若是专家自己依然很臃肿，，，，，激活数目一多，，，，，算力照样压不下来。。。。。。

而希罕MoE主打一个“能省则省”——能用一个专家解决的，，，，，绝不叫两个；；能用小专家解决的，，，，，绝不叫大专家。。。。。。

于是，，，，，U2在MoE之前加了一道“希罕知识编码+知识蒸馏”的程序，，，，，把每个专家的知识做一遍精炼提纯，，，，，让每个专家变得更精悍。。。。。。

而数据和架构的威力一叠加，，，，，U2便依附2660亿参数，，，，，抵达了1.2万亿参数模子的性能，，，，，参数效率靠近后者的5倍。。。。。。

至于Token该怎么省，，，，，U2选择从推理环节动刀。。。。。。

为了让模子想得更深，，，，，主流做法是把完整头脑链逐Token睁开输出——效果确实好，，，，，但Token也烧得飞快，，，，，重大使命里真正贵的往往不是谜底，，，，，而是那一大堆思索历程。。。。。。

而U2在实践中发明，，，，，不说出思索历程，，，，，谜底一样靠得住。。。。。。详细他们干了两件事：

一是精简推理路径，，，，，直接砍掉无效方法和兜圈子的冗余推导；；二是类比人脑解题方式引入隐式思索机制，，，，，在隐藏层先把解题偏向想清晰，，，，，再进入显式推理的细化验证，，，，，大宗中心历程基础不需要睁开成Token输出。。。。。。

以是说，，，，，古板模子是边想边说，，，，，而U2更像先想明确、再挑重点说。。。。。。

△图片由AI天生

靠着这一设计，，，，，U2在保存多路径探索与后续可验证性的同时，，，，，可将思索Token消耗量镌汰约25%。。。。。。

25%什么看法？？放在企业级长链路使命里，，，，，这个数字带来的本钱差别，，，，，只能说懂的都懂了。。。。。。

而这还没完，，，，，U2还把原生Agent能力和Harness Engineering放进了统一个训练闭环。。。。。。

Harness会凭证模子特点一连优化，，，，，模子再使用Harness返回的真实使命数据，，，，，继续强化多步妄想、工具挪用和历程纠错能力。。。。。。双方相互喂数据、相互进化。。。。。。

效果就是，，，，，U2的Agent能力不是后天外挂的，，，，，而是原生长出来的。。。。。。

而“原生”意味着，，，，，模子完成重大使命时需要的交互轮次更少、上下文更短，，，，，单次营业Token本钱也会进一步下降。。。。。。

到这里你发明没，，，，，在U2身上，，，，，小参数、强能力、少Token并非取舍，，，，，而是被同时设计进去的。。。。。。

从理念到工程设计，，，，，U2每一层都在往统一个偏向使劲：

让智能更密、让Token更值。。。。。。

为什么是云知声

好，，，，，现在我已经知道有U2这样一个模子了，，，，，但问题是：

为什么在各人普遍以为大模子竞争名堂已经收敛之时，，，，，云知声还要往里闯？？并且还真让它闯进去了？？

一切可以追溯到上个月，，，，，晚点LatePost对云知声首创人黄伟的采访。。。。。。

黄伟的判断很直接：2023到2025年是大模子的热身赛，，，，，2026年正赛才刚最先。。。。。。

乍一听有点像时势话，，，，，但仔细想想还真不是。。。。。。

热身赛比的是参数、算力和资源投入，，，，，实质上是一场资源消耗战。。。。。。而现在，，，，，AI正从“天生式”迈入“生产力”时代——模子要真正下场干活了，，，，，每一个Token都得换回真实的营业价值。。。。。。

以是，，，，，虽然走的照旧通用大模子这条路，，，，，但已经不是统一场角逐了。。。。。。已往比谁投入更多资源，，，，，现在比谁能创立更多价值，，，，，评分标准已经悄悄改变。。。。。。

说白了，，，，，以前那套竞争名堂或许已经收敛，，，，，但新的竞争名堂，，，，，才刚刚睁开。。。。。。

这也诠释了为啥云知声第一代基；；菇小吧胶！，，，，，现在却酿成了“U2”，，，，，它代表的正是这种AI范式的转变。。。。。。

△图片由AI天生

而在这套新的竞争系统下，，，，，云知声已往十几年攒下的“家底”最先施展作用了。。。。。。

那些一经看起来不敷性感、甚至有些“慢”的积累，，，，，现在反而成了它攻击第一梯队的主要筹码。。。。。。

云知声2012年依附语音识别起身，，，，，去年刚完成港股上市，，，，，被外界普遍视为“港股AGI第一股”。。。。。。

许多人一看它名字里有“声”，，，，，就下意识以为这是一家语音公司，，，，，但这着实是一种误解。。。。。。

准确翻开方式是，，，，，三个字看全——“云”是智能的载体，，，，，“知”是认知的焦点，，，，，“声”只是进入这个天下的第一扇门。。。。。。

在黄伟看来，，，，，他们听的历来不是声音，，，，，而是声音背后的意识。。。。。。

何谓“声音背后的意识”？？焦点有三层，，，，，换成示意图明确如下：

△图片由AI天生

看到没，，，，，为了搞懂“声音背后的意识”，，，，，云知声着实一起都在升级自己的能力界线。。。。。。

最早做语音识别，，，，，解决“听懂”的问题；；厥后做智能交互，，，，，解决“明确意图”的问题；；再厥后，，，，，当目的酿成明确情绪、场景和恒久需求时，，，，，单点手艺已经不敷用了，，，，，背后需要一个能够推理、妄想和行动的智能大脑。。。。。。

以是从某种意义上说，，，，，云知声并不是突然转型做大模子，，，，，而是在追逐“让机械真正明确人”这件事的历程中，，，，，一步步走到了大模子这里。。。。。。

这也诠释了它今天为什么把自己定位为：原生智能体基座大模子公司。。。。。。

不是赶风口，，，，，是这条线走到现在，，，，，自然走到了这个位置。。。。。。

而在Agent时代，，，，，这段积累尤其值钱。。。。。。

就这么说吧，，，，，现在各人熟知的大模子玩家，，，，，险些都是2023年前后麋集冒出来的新面目，，，，，但云知声不是。。。。。。

早在AI 1.0时代，，，，，它就已经在做真实场景落地了。。。。。。

多年来，，，，，它一直坚持“强基模+深应用”的蹊径：一边自主研发底层模子能力，，，，，一边扎根工业场景做深度落地。。。。。。

围绕智慧医疗和智慧生涯两条营业主线，，，，，它积累了大宗真实数据、真实需求，，，，，以及真实反馈。。。。。。

而这些，，，，，正是大模子时代最稀缺、也最值钱的工具。。。。。。

更要害的是，，，，，这种来自真实场景的压力，，，，，还倒逼出了云知声自己奇异的一套要领论：不追求参数规模，，，，，追求更高的智能密度、更低的推理本钱、更强的落地能力。。。。。。

说到这里，，，，，有个细节很值得一提。。。。。。众所周知，，，，，老黄喜欢说token efficiency，，，，，“同样100万token，，，，，我用更少的电费、更少的算力把它生产出来”，，，，，但这只是生产端的看法。。。。。。

而云知声一步到位，，，，，想的是“这100万token生产出来之后，，，，，它究竟值几多钱”。。。。。。效率再高，，，，，若是全是空话，，，，，商业价值也是零。。。。。。

围绕这个逻辑，，，，，云知声搭了一套完整的系统：底层是U2这样的基座大模子，，，，，中心是兽牙智能体平台，，，，，上层一端毗连医疗、医保、交通、客服等工业场景，，，，，另一端通过MaaS和生态平台触达开发者与个人用户。。。。。。

模子创立价值，，，，，价值爆发Token消耗，，，，，Token消耗转化为收入，，，，，属于云知声的“Token经济学”就此闭环跑通了。。。。。。

而最新的数据，，，，，已经最先验证这套逻辑。。。。。。

已往几年云知声发声未几，，，，，一部分原因是港股上市静默期的客观限制。。。。。。

但现在静默期竣事了，，，，，财报也摆在那里：不到500人的团队，，，，，年营收凌驾10亿元，，，，，大模子相关收入突破6.1亿元，，，，，同比增添凌驾10倍。。。。。。

更直接的信号来自Token营业，，，，，量子位探询到，，，，，云知声今年5月Token挪用收入ARR环比增添了600%，，，，，预计6月仍将坚持高速增添。。。。。。

这意味着，，，，，云知声的收入已经和客户创立的AI价值直接挂钩了，，，，，客户用得越多、价值越大，，，，，收入的天花板也随着翻开。。。。。。

“智能密度×Token价值”这套逻辑，，，，，不再只是理念，，，，，而是已经最先在财报上展现。。。。。。

以是回过头看U2，，，，，外貌上，，，，，它以1/10的Token本钱重构了重大使命的本钱结构，，，，，让许多已往算不过账的AI场景，，，，，第一次具备了大规模安排的可能。。。。。。

实质上，，，，，它验证的是“智能密度”这条蹊径自己的可行性：性能不是堆出来的，，，，，本钱不是靠降质量省下来的，，，，，两件事可以同时爆发。。。。。。

当每一个Token都能创立更多价值时，，，，，显而易见，，，，，“更大”便不再是唯一谜底——

行业的评价坐标，，，，，将从“谁的模子更大”，，，，，逐渐转向“谁的模子更值”。。。。。。

而U2，，，，，正是这一转变的第一块试金石。。。。。。

在线体验：https://maas.unisound.com/models/u2

　

【编辑者：竺欣怡】

相关标签

宝妈天天用84拖地致肺炎德中分子医学与分子药学学会举行2026年首期德中学术交流会 NBA总决赛最高票价超两百万元，，，，，特朗普：许多人约请我去看菲律宾粤商总会会长林翰：联动侨团资源双向赋能川渝工业落地东南亚

文章点评

未盘问到任何数据！

揭晓谈论

◎接待加入讨论，，，，，请在这里揭晓您的看法、交流您的看法。。。。。。

【网站地图】