凯时AG

2026-07-04 19:38:43 设为首页 | 加入珍藏

OpenSquilla宣布0.4.0:AI写代码首次能“自我验证”

2026-07-04 19:38:43 宣布 泉源:百度资讯 作者:陈宏贤 浏览:3809次

记者6月30日获悉,,,,, ,开源AI Agent项目OpenSquilla克日宣布0.4.0 版本,,,,, ,焦点更新是推出编码事情流coding模式,,,,, ,并首次为AI编码引入“自我验证”机制:AI不再止步于“我改好了”口头交付,,,,, ,而是在交回效果前,,,,, ,先用测试为自己跑出一份可复核的、证实“改对了”的证据。。

这一机制指向AI Coding目今最棘手的瓶颈——信任。。

从工业来看,,,,, ,已往一年,,,,, ,AI写代码能力突飞猛进,,,,, ,但“能写”不即是“能信”:大都编码Agent改完即交,,,,, ,对错仍要人逐行复核,,,,, ,这是AI编码难以真正无人值守、规;;;;;;肷樾蔚囊φ习。。把验证内化进Agent自身,,,,, ,意味着行业评判AI编码的标准,,,,, ,正从“它声称改对了”转向“它能否自证改对了”。。

其做法是一条自力的“红绿回归证据链”:先写一个注定失败的测试给问题定性、证实它真能捉住bug,,,,, ,再把功效做好让测试由红转绿,,,,, ,最后跑一遍项目原有测试确认没弄坏别处;;;;;;三关全过才算交付,,,,, ,任一不过直接打回。。配套尚有默认的自动修复闭环。。

在官方的案例演示中,,,,, ,Coding模式为着名开源项目micrograd,,,,, ,AI教育圈顶流、Anthropic研究员Andrej Karpathy的极简自动微分库,,,,, ,新增了“盘算准确梯度”的功效——而梯度一旦算错,,,,, ,模子不报错也不瓦解,,,,, ,只会悄悄越学越偏,,,,, ,是最难靠肉眼发明的bug。。演示分两步:先由AI走完上述“红→绿→回归”三关、自交证据;;;;;;再由人把micrograd的新功效与行业标准工具PyTorch在统一道题上并排比对,,,,, ,前向值与每一个梯度小数点后10位完全一致。;;;;;;谎灾,,,, ,不是“AI自己说对”,,,,, ,而是“它和官方标准谜底分绝不差”。。

同期,,,,, ,OpenSquilla推出首个署名并公证的桌面装置包,,,,, ,macOS与Windows均可双击装置、无需下令行。。

OpenSquilla主打“提升单位本钱的Agent智能”,,,,, ,以Learnable Harness为切入点,,,,, ,目的打造性价比最高的Agent产品。。

现在,,,,, ,主流Agent框架普遍推高模子挪用、Token本钱攀升,,,,, ,因此怎样压降本钱成为各玩家配合面临的话题。。OpenSquilla官网称,,,,, ,通例场景内测综合本钱可下降约60—80%。。

果真报道显示,,,,, ,基元律动首创人王云鹤曾认真头部科技公司大模子研发。。公司建设仅数月即完成首轮融资,,,,, ,是Harness和Agent原生模子偏向上为数未几的代表性玩家。。OpenSquilla上线后数周内GitHub star增至数千量级。。

3.阻止室外大型聚会和高空等户外危险作业。。

责任编辑:陈冰茹    校对:张育枝

今日热门

  1. 18国记者走读江阴:长江大;;;;;;な昙ひ唤趟卵
  2. 新疆乌。。浩葡突降雨夹雪 民警连夜奋战护平安
  3. 又一万亿级投资周期开启!“算”出我国数字经济新底座
  4. 上海大学转达论文数据存疑问题:与周某某解聘 免去苏某某院长职务
  5. 纪录片|永远的“四大队”
  6. 中国智库报告:日菲不得借所谓“划界”挑战一其中国原则
  7. 亚宝药业子公司取得依折麦布片注册证
  8. 驾校“花钱包过”无异于作育“马路杀手”
  9. 中东部暑热升级河南等地高温频仍 南方明起迎新一轮强降雨历程
  10. 热干面配天下杯 武汉这家早餐店火了

相关推荐

【网站地图】