凯时AG

2026-07-03 09:41:29 设为首页 | 加入珍藏

OpenSquilla宣布0.4.0:AI写代码首次能“自我验证”

2026-07-03 09:41:29 宣布 泉源:河东软件园 作者:王国伟 浏览:7161次

记者6月30日获悉,,,,开源AI Agent项目OpenSquilla克日宣布0.4.0 版本,,,,焦点更新是推出编码事情流coding模式,,,,并首次为AI编码引入“自我验证”机制:AI不再止步于“我改好了”口头交付,,,,而是在交回效果前,,,,先用测试为自己跑出一份可复核的、证实“改对了”的证据 。。。

这一机制指向AI Coding目今最棘手的瓶颈——信任 。。。

从工业来看,,,,已往一年,,,,AI写代码能力突飞猛进,,,,但“能写”不即是“能信”:大都编码Agent改完即交,,,,对错仍要人逐行复核,,,,这是AI编码难以真正无人值守、规;;;;;;肷樾蔚囊φ习 。。。把验证内化进Agent自身,,,,意味着行业评判AI编码的标准,,,,正从“它声称改对了”转向“它能否自证改对了” 。。。

其做法是一条自力的“红绿回归证据链”:先写一个注定失败的测试给问题定性、证实它真能捉住bug,,,,再把功效做好让测试由红转绿,,,,最后跑一遍项目原有测试确认没弄坏别处;;;;;;三关全过才算交付,,,,任一不过直接打回 。。。配套尚有默认的自动修复闭环 。。。

在官方的案例演示中,,,,Coding模式为着名开源项目micrograd,,,,AI教育圈顶流、Anthropic研究员Andrej Karpathy的极简自动微分库,,,,新增了“盘算准确梯度”的功效——而梯度一旦算错,,,,模子不报错也不瓦解,,,,只会悄悄越学越偏,,,,是最难靠肉眼发明的bug 。。。演示分两步:先由AI走完上述“红→绿→回归”三关、自交证据;;;;;;再由人把micrograd的新功效与行业标准工具PyTorch在统一道题上并排比对,,,,前向值与每一个梯度小数点后10位完全一致 。。;;;;;;谎灾,,,不是“AI自己说对”,,,,而是“它和官方标准谜底分绝不差” 。。。

同期,,,,OpenSquilla推出首个署名并公证的桌面装置包,,,,macOS与Windows均可双击装置、无需下令行 。。。

OpenSquilla主打“提升单位本钱的Agent智能”,,,,以Learnable Harness为切入点,,,,目的打造性价比最高的Agent产品 。。。

现在,,,,主流Agent框架普遍推高模子挪用、Token本钱攀升,,,,因此怎样压降本钱成为各玩家配合面临的话题 。。。OpenSquilla官网称,,,,通例场景内测综合本钱可下降约60—80% 。。。

果真报道显示,,,,基元律动首创人王云鹤曾认真头部科技公司大模子研发 。。。公司建设仅数月即完成首轮融资,,,,是Harness和Agent原生模子偏向上为数未几的代表性玩家 。。。OpenSquilla上线后数周内GitHub star增至数千量级 。。。

(3)请以“由于神往”为问题,,,,写一首小诗或一段抒情文字 。。。要求:情绪真挚,,,,语言生动,,,,有熏染力 。。。

责任编辑:吴姿颖    校对:魏欢钰

今日热门

  1. 为什么特朗普“不得不”常买中国货
  2. 天士力:获富马酸伏诺拉生片注册证书
  3. 美国、伊朗、巴基斯坦为何不约而同“谢谢中方”
  4. 【好评中国】考出“三夏”好效果,,,,绘就整年好“丰”景
  5. 今年4月A股新开户数249.13万户
  6. 赵文卓闽超一声振兴中华全场沸腾
  7. 2026年全民数字素养与手艺提升月启动
  8. 北方晴热一连高温规模将扩大 南方明起迎新一轮降雨历程
  9. 中央财务下达育儿津贴津贴资金999亿元
  10. 热门产品“一天一个价” “半导体血液”生产企业爆单

相关推荐

【网站地图】