凯时AG

2026-07-02 06:33:04 设为首页 | 加入珍藏

OpenSquilla宣布0.4.0:AI写代码首次能“自我验证”

2026-07-02 06:33:04 宣布 泉源:中兴应用市肆 作者:李俊依 浏览:9482次

记者6月30日获悉,,开源AI Agent项目OpenSquilla克日宣布0.4.0 版本,,焦点更新是推出编码事情流coding模式,,并首次为AI编码引入“自我验证”机制:AI不再止步于“我改好了”口头交付,,而是在交回效果前,,先用测试为自己跑出一份可复核的、证实“改对了”的证据 。。。。。

这一机制指向AI Coding目今最棘手的瓶颈——信任 。。。。。

从工业来看,,已往一年,,AI写代码能力突飞猛进,,但“能写”不即是“能信”:大都编码Agent改完即交,,对错仍要人逐行复核,,这是AI编码难以真正无人值守、规;;;肷樾蔚囊φ习 。。。。。把验证内化进Agent自身,,意味着行业评判AI编码的标准,,正从“它声称改对了”转向“它能否自证改对了” 。。。。。

其做法是一条自力的“红绿回归证据链”:先写一个注定失败的测试给问题定性、证实它真能捉住bug,,再把功效做好让测试由红转绿,,最后跑一遍项目原有测试确认没弄坏别处;;;三关全过才算交付,,任一不过直接打回 。。。。。配套尚有默认的自动修复闭环 。。。。。

在官方的案例演示中,,Coding模式为着名开源项目micrograd,,AI教育圈顶流、Anthropic研究员Andrej Karpathy的极简自动微分库,,新增了“盘算准确梯度”的功效——而梯度一旦算错,,模子不报错也不瓦解,,只会悄悄越学越偏,,是最难靠肉眼发明的bug 。。。。。演示分两步:先由AI走完上述“红→绿→回归”三关、自交证据;;;再由人把micrograd的新功效与行业标准工具PyTorch在统一道题上并排比对,,前向值与每一个梯度小数点后10位完全一致 。。。。;;;谎灾,,不是“AI自己说对”,,而是“它和官方标准谜底分绝不差” 。。。。。

同期,,OpenSquilla推出首个署名并公证的桌面装置包,,macOS与Windows均可双击装置、无需下令行 。。。。。

OpenSquilla主打“提升单位本钱的Agent智能”,,以Learnable Harness为切入点,,目的打造性价比最高的Agent产品 。。。。。

现在,,主流Agent框架普遍推高模子挪用、Token本钱攀升,,因此怎样压降本钱成为各玩家配合面临的话题 。。。。。OpenSquilla官网称,,通例场景内测综合本钱可下降约60—80% 。。。。。

果真报道显示,,基元律动首创人王云鹤曾认真头部科技公司大模子研发 。。。。。公司建设仅数月即完成首轮融资,,是Harness和Agent原生模子偏向上为数未几的代表性玩家 。。。。。OpenSquilla上线后数周内GitHub star增至数千量级 。。。。。

肩负新使命,,迈向新征程 。。。。。新型导弹方阵日新月异,,“春风家族”变大了、掷中精度更高了、突防能力更强了、攻击规模更广了,,尽显守护国家清静安定“王牌”“底牌”的底气锐气 。。。。。

责任编辑:崔宛玲    校对:林家铭

今日热门

  1. 美媒报道 五角大楼因危险品传感系统误报疏散职员
  2. 新闻人士称美伊谈判仍处于暂停状态
  3. 500余名骑手破风骑行 车轮与秦岭对话赋能县域生长
  4. 黎巴嫩接待延伸黎以;;; 以色列继续空袭黎南部
  5. 工具问丨薛子敬:中东时势波动,,中国制造业为何仍能坚持相对稳固??????
  6. 加拿大:拟榨取16岁以下青少年注册社交媒体账号
  7. 天下中学生羽毛球精英赛在云南昭通开赛 400余名选手挥拍争锋
  8. 广东暴雨天蟑螂成群出动
  9. “假煽情”照旧“真须要”为啥部分家长阻挡成人礼??????
  10. 端午佳节 浙江绍兴端阳宴开席

相关推荐

【网站地图】