凯时AG

泉源:婚礼伉俪对拜新郎半数式鞠躬作者: 胡瑶光:

GLM 5.2:给国产模子追赶Anthropic 又提了一口吻|附实测

作者 | 董道力邮箱 | dongdaoli@pingwest.com

开源, ,曾是美国科技工业最值得自满的发明之一。 。 。 。。。

1984 年, ,麻省理工学院人工智能实验室里, ,一位留着大胡子、眼神强硬的程序员彻底被激怒了。 。 。 。。。打印机坏了, ,厂商却不肯交出源码。 。 。 。。。他一气之下辞掉体面的事情, ,写下 GNU 宣言。 。 。 。。。Richard Stallman 或许不会想到, ,这份带着理想主义怒气的檄文, ,会在接下来的四十年里, ,重塑整个软件天下的权力名堂。 。 。 。。。

美国一经是开源运动最肥沃的土壤。 。 。 。。。1991 年, ,一个芬兰学生在 Usenet 上宣布了一段操作系统内核代码, ,但真正让 Linux 从极客玩具酿玉成球互联网基础设施的, ,是美国企业的接力和背书。 。 。 。。。IBM 投入十亿美元, ,Red Hat 靠它上市, ,Google 用它跑起了搜索帝国。 。 。 。。。

然后, ,时间来到 2026 年 6 月 11 日。 。 。 。。。

一封来自美国商务部长的信, ,寄到了 Anthropic CEO Dario Amodei 的案头。 。 。 。。。信件内容很短, ,语气却禁止置疑:以国家清静权限为由, ,暂停所有外国人对 Fable 5 和 Mythos 5 模子的会见。 。 。 。。。限制规模极广, ,不但包括境外用户, ,也包括身在美国境内的外国人, ,甚至包括 Anthropic 自己的外籍员工。 。 。 。。。没有果真手艺细节, ,没有申诉窗口, ,48 小时内执行。 。 。 。。。

两天后, ,6 月 13 日, ,智谱宣布声明:GLM-5.2, ,将于下周正式开源。 。 。 。。。它支持 100 万 token 上下文, ,是智谱现在最强模子, ,接纳 MIT 协议, ,无任何地区限制。 。 。 。。。

官方声明里这样写到:

“在一些前沿模子突然变得不可用的时刻, ,我们选择了另一条路:前沿智能不应只属于少数人, ,也不应被少数规则随时收回。 。 。 。。。它应该开放、可用、可构建, ,并服务于每一位开发者。 。 。 。。。”

来自中国的开源模子, ,已经成了这一轮AI浪潮里, ,开放普惠的代表。 。 。 。。。他们在起劲提供紧跟前沿闭源模子的能力给所有人, ,而现在是时间越发高抬高打和更激进的推动这件事了。 。 。 。。。

虽然, ,弘大叙事归弘大叙事。 。 。 。。。GLM-5.2 究竟好欠好用, ,最终照旧要靠实测语言。 。 。 。。。

以下是我们第一时间的实测。 。 。 。。。

我们选了智谱刚刚宣布的 ZCode 3.0 作为测试台。 。 。 。。。它周全切换了自研的 ZCode Agent 内核, ,对满血 GLM 做了深度优化, ,长程推理、工具挪用和大型工程执行链路都针对 GLM 系列做了专门调校。 。 。 。。。

测试 1:动态月相时钟

最终输出一个可直接运行的完整 HTML 文件。 。 。 。。。

GLM5.2 以单 HTML 文件完成了一座机械天文钟, ,约 925 行纯前端代码, ,零外部依赖。 。 。 。。。手艺栈越薄, ,视觉的担子越重——齿轮齿形、月相明暗线、星轨椭圆, ,全靠 SVG path 一笔笔算出来, ,没有贴图, ,没有 Canvas 兜底。 。 。 。。。

它没有走"挤牙膏"式的增量开发, ,第一发就一口吻写完整整 900 行骨架:五层同心 SVG、七颗齿轮、60 分钟刻度、椭圆星轨、月相盘、三速率指针、控制面板所有搭通, ,首版翻开即转。 。 。 。。。

随后它自己 review 了一遍代码, ,挖出三个真 bug 并逐一修复。 。 。 。。。

最值得一提的是, ,GLM5.2 不堆屎山, ,发明错了敢整段重写。 。 。 。。。

以月相为例, ,第一个版本 GLM5.2 用的是 mask 配一个位移缩放的阴影圆, ,函数里还留着多行被注释掉的试错推导, ,半月时分界不是直线, ,新月时压根遮不住。 。 。 。。。它没有继续在 mask 上凑手感, ,而是直接推倒, ,换成 terminator 双弧 path。 。 。 。。。改完不靠感受验收, ,而是拿四个界线相位打表验证:新月亮区恰恰为零、上弦右半圆、满月整圆、下弦左半圆, ,所有吻合。 。 。 。。。

但 GLM5.2 天生的时钟, ,颜值上就很有前进空间了。 。 。 。。。

测试 2:互动点球大战

输出:完整可运行的单 HTML 文件(Cannon.js CDN)。 。 。 。。。

GLM5.2 天生的游戏内容相当完整:五轮攻防、三档 AI 难度、拖拽射门配马格努斯弧线、AI 预判扑救、加时赛一应俱全。 。 。 。。。视觉上, ,草地是程序天生的, ,足球用真五边形拼接而成, ,1400 个观众剪影批量渲染。 。 。 。。。

值得关注的, ,是 GLM5.2 的开发思绪:先让游戏能玩, ,再逐步打磨。 。 。 。。。

第一步就把完整骨架搭了起来:射门、扑救、判断、回合切换所有跑通。 。 。 。。。后续遇到问题, ,每次修复都遵照一套清晰流程:发明问题 → 挖根因 → 给方案 → 调数值 → 跑语法检查。 。 。 。。。

举个例子。 。 。 。。。CapsuleGeometry 在老版本 Three.js 里并不保存, ,GLM5.2 直接诊断出 r128 的 LatheGeometry 是 ES6 class、不可用 .call() 借调, ,于是改用 extends + super, ,然后逐个验证:结构乐成、形状准确、node --check 通过。 。 。 。。。

GLM5.2 还会凭证语言特征做针对性设计, ,像个有履历的内行。 。 。 。。。好比守门员被刻意不放进物理引擎, ,而是手写距离检测, ,巧妙避开了 Cannon.js 那种鬼畜弹跳, ,彻底解决了"球穿门将"的 bug。 。 。 。。。

最值得一提的, ,是它做动画优化的方式, ,直接找专业文献。 。 。 。。。

门将扑救行动的早期版本很僵硬:先是"起跳", ,再改成"横飞", ,照旧不敷自然。 。 。 。。。GLM5.2 没有凭感受硬调, ,而是去查了 Ibrahim et al。 。 。 。。。 (2019) 等关于西甲精英门将扑救生物力学的研究, ,直接从论文里提取出真实的时间参数——对侧腿蹬地发力 0.12 秒 → 重心横移 0.18 秒 → 手臂鞭打舒展 0.25 秒。 。 。 。。。

据此, ,它把动画拆成三阶段重写:身体压缩蓄力 → 躯干弹射横移 → 手臂直线舒展够球。 。 。 。。。每一帧的旋转偏向都用数值要领验证过, ,确保脚、腿、躯干、手始终成一条直线、朝着球飞去。 。 。 。。。

我把 GLM5.2 引用的每个数据源都翻开检查过, ,一个也没有瞎编, ,都是真实保存的网页。 。 。 。。。

测试 3:做一个迷你 Excel

这个项目主要让GLM5.2做一个零依赖、单文件 HTML 的简化版 Excel, ,可在浏览器中直接翻开运行, ,具备焦点电子表格能力:网格编辑、公式引擎、作废重做、剪贴板、CSV 导入导出等, ,是一个较量综合的项目。 。 。 。。。

GLM-5.2 跑了一小时, ,把 Excel 桌面端焦点体验——用浏览器还原。 。 。 。。。

可以实现完整的编辑功效, ,单击/双击/Enter 切换状态, ,偏向键、Tab、PageUp/Down、Ctrl+Home 全套快捷键等。 。 。 。。。用 TS实现公式引擎, ,递归下降剖析 + 相对/绝对/混淆引用 + 30+ 函数。 。 。 。。。常用的工具栏, ,像加粗/斜体/对齐、5 种数字名堂、60 步作废重做。 。 。 。。。

参考这个项目来看, ,GLM-5.2 并非没有问题, ,它在架构设计上有相当扎实的工程能力, ,但执行节奏严重失衡。 。 。 。。。好比14 分钟已往, ,可见产出还停留在"设计讨论 + 零星代码片断", ,从未真正写出可运行的 HTML 文件。 。 。 。。。

换句话说, ,GLM-5.2 是一个想得许多的模子。 。 。 。。。三思此后行是优点, ,但若是最后没把功效跑出来, ,再深的思索也只停留在原地。 。 。 。。。

我在使用的时间, ,经 ;;;;嵯右墒遣皇悄W涌ㄗ×, ,忍不住让其暂停, ,再输入继续指令。 。 。 。。。

客观来看, ,GLM-5.2 与 Claude 等国际顶尖模子相比, ,仍然保存差别。 。 。 。。。它的界面审美有待提升, ,重大使命中有时会长时间思索, ,迟迟不输出可运行代码。 。 。 。。。

但主要的是, ,它证实晰另一件事:国产大模子已经具备了实着实在的工程能力。 。 。 。。。

GLM-5.2 能在无外部依赖的情形下, ,一次天生 900 多行可运行的 SVG 机械钟代码 ;;;;能在发明自身 bug 后自动推倒重写 ;;;;能在 Three.js 和 Cannon.js 的手艺坑里自主定位问题 ;;;;也能破费一小时, ,在纯浏览器情形中复刻 Excel 的焦点体验。 。 。 。。。

更要害的是, ,智谱选择了一条稳固开源的蹊径。 。 。 。。。

GLM-5.2 让“能用的国产模子”从口号酿成了可运行的代码。 。 。 。。。用户不需要申请特殊权限, ,不必担心某天清早醒来发明 API 被突然掐断, ,也不需要在阅读文档前签署一份出口合规声明。 。 。 。。。

它在此前已经是国产模子coding最强之一的GLM-5.1基础上, ,又有显着前进, ,整体变得越发能打。 。 。 。。。

在Anthropic和OpenAI最近的模子眼看又要拉开和其他模子差别的时刻, ,GLM-5.2的泛起简直能给所有国产模子提一口吻。 。 。 。。。

点个“爱心”, ,再走 吧

@张正爱:彩尊登录官网, ,河南驻马店突生气情????谣言
@萧白惟:张雪回应成于东来直播间“榜一年迈”
@倪怡如:新疆一连推进塔克拉玛干沙漠锁边工程

热门排行

【网站地图】