凯时AG

OpenSquilla宣布0.4.0：AI写代码首次能“自我验证”

作者：谢珊宪

宣布时间：2026-07-04 11:18:59

阅读量：8262

OpenSquilla宣布0.4.0：AI写代码首次能“自我验证”

记者6月30日获悉，，，，，，开源AI Agent项目OpenSquilla克日宣布0.4.0 版本，，，，，，焦点更新是推出编码事情流coding模式，，，，，，并首次为AI编码引入“自我验证”机制：AI不再止步于“我改好了”口头交付，，，，，，而是在交回效果前，，，，，，先用测试为自己跑出一份可复核的、证实“改对了”的证据。。。。

这一机制指向AI Coding目今最棘手的瓶颈——信任。。。。

从工业来看，，，，，，已往一年，，，，，，AI写代码能力突飞猛进，，，，，，但“能写”不即是“能信”：大都编码Agent改完即交，，，，，，对错仍要人逐行复核，，，，，，这是AI编码难以真正无人值守、规；；；；；；肷樾蔚囊φ习。。。。把验证内化进Agent自身，，，，，，意味着行业评判AI编码的标准，，，，，，正从“它声称改对了”转向“它能否自证改对了”。。。。

其做法是一条自力的“红绿回归证据链”：先写一个注定失败的测试给问题定性、证实它真能捉住bug，，，，，，再把功效做好让测试由红转绿，，，，，，最后跑一遍项目原有测试确认没弄坏别处；；；；；；三关全过才算交付，，，，，，任一不过直接打回。。。。配套尚有默认的自动修复闭环。。。。

在官方的案例演示中，，，，，，Coding模式为着名开源项目micrograd，，，，，，AI教育圈顶流、Anthropic研究员Andrej Karpathy的极简自动微分库，，，，，，新增了“盘算准确梯度”的功效——而梯度一旦算错，，，，，，模子不报错也不瓦解，，，，，，只会悄悄越学越偏，，，，，，是最难靠肉眼发明的bug。。。。演示分两步：先由AI走完上述“红→绿→回归”三关、自交证据；；；；；；再由人把micrograd的新功效与行业标准工具PyTorch在统一道题上并排比对，，，，，，前向值与每一个梯度小数点后10位完全一致。。。；；；；；；谎灾，，，，，，不是“AI自己说对”，，，，，，而是“它和官方标准谜底分绝不差”。。。。

同期，，，，，，OpenSquilla推出首个署名并公证的桌面装置包，，，，，，macOS与Windows均可双击装置、无需下令行。。。。

OpenSquilla主打“提升单位本钱的Agent智能”，，，，，，以Learnable Harness为切入点，，，，，，目的打造性价比最高的Agent产品。。。。

现在，，，，，，主流Agent框架普遍推高模子挪用、Token本钱攀升，，，，，，因此怎样压降本钱成为各玩家配合面临的话题。。。。OpenSquilla官网称，，，，，，通例场景内测综合本钱可下降约60—80%。。。。

果真报道显示，，，，，，基元律动首创人王云鹤曾认真头部科技公司大模子研发。。。。公司建设仅数月即完成首轮融资，，，，，，是Harness和Agent原生模子偏向上为数未几的代表性玩家。。。。OpenSquilla上线后数周内GitHub star增至数千量级。。。。

　

【编辑者：李雨旺】

相关标签

“小满”遇上“521”新人甜蜜领证：不求圆满求恰恰中国人爱上“坐着邮轮去旅行”（国际论道）山东青岛：近240米高楼主体封顶都会沿海再添新地标天下超等摩托车锦标赛捷克站：“张雪机车”夺赛季第五冠

文章点评

未盘问到任何数据！

揭晓谈论

◎接待加入讨论，，，，，，请在这里揭晓您的看法、交流您的看法。。。。

【网站地图】