凯时AG

2026-07-03 03:28:08 设为首页 | 加入珍藏

OpenSquilla宣布0.4.0:AI写代码首次能“自我验证”

2026-07-03 03:28:08 宣布 泉源:麦葱下载 作者:周嘉玲 浏览:6672次

记者6月30日获悉,,,,,,开源AI Agent项目OpenSquilla克日宣布0.4.0 版本,,,,,,焦点更新是推出编码事情流coding模式,,,,,,并首次为AI编码引入“自我验证”机制:AI不再止步于“我改好了”口头交付,,,,,,而是在交回效果前,,,,,,先用测试为自己跑出一份可复核的、证实“改对了”的证据。。。

这一机制指向AI Coding目今最棘手的瓶颈——信任。。。

从工业来看,,,,,,已往一年,,,,,,AI写代码能力突飞猛进,,,,,,但“能写”不即是“能信”:大都编码Agent改完即交,,,,,,对错仍要人逐行复核,,,,,,这是AI编码难以真正无人值守、规模;; ;;肷樾蔚囊φ习。。。把验证内化进Agent自身,,,,,,意味着行业评判AI编码的标准,,,,,,正从“它声称改对了”转向“它能否自证改对了”。。。

其做法是一条自力的“红绿回归证据链”:先写一个注定失败的测试给问题定性、证实它真能捉住bug,,,,,,再把功效做好让测试由红转绿,,,,,,最后跑一遍项目原有测试确认没弄坏别处;;; ;;三关全过才算交付,,,,,,任一不过直接打回。。。配套尚有默认的自动修复闭环。。。

在官方的案例演示中,,,,,,Coding模式为着名开源项目micrograd,,,,,,AI教育圈顶流、Anthropic研究员Andrej Karpathy的极简自动微分库,,,,,,新增了“盘算准确梯度”的功效——而梯度一旦算错,,,,,,模子不报错也不瓦解,,,,,,只会悄悄越学越偏,,,,,,是最难靠肉眼发明的bug。。。演示分两步:先由AI走完上述“红→绿→回归”三关、自交证据;;; ;;再由人把micrograd的新功效与行业标准工具PyTorch在统一道题上并排比对,,,,,,前向值与每一个梯度小数点后10位完全一致。。。;; ;;谎灾,,,,,,不是“AI自己说对”,,,,,,而是“它和官方标准谜底分绝不差”。。。

同期,,,,,,OpenSquilla推出首个署名并公证的桌面装置包,,,,,,macOS与Windows均可双击装置、无需下令行。。。

OpenSquilla主打“提升单位本钱的Agent智能”,,,,,,以Learnable Harness为切入点,,,,,,目的打造性价比最高的Agent产品。。。

现在,,,,,,主流Agent框架普遍推高模子挪用、Token本钱攀升,,,,,,因此怎样压降本钱成为各玩家配合面临的话题。。。OpenSquilla官网称,,,,,,通例场景内测综合本钱可下降约60—80%。。。

果真报道显示,,,,,,基元律动首创人王云鹤曾认真头部科技公司大模子研发。。。公司建设仅数月即完成首轮融资,,,,,,是Harness和Agent原生模子偏向上为数未几的代表性玩家。。。OpenSquilla上线后数周内GitHub star增至数千量级。。。

中国旅游景区协会理事长 霍建军:标准还新增了适老化的导览界面和无障碍设施的导览内容,,,,,,包管晚年人、游客以及残障人士能够利便地使用智慧化系统。。。

责任编辑:蔡大帆    校对:连凯琳

今日热门

  1. 浙江一馆藏战国青铜剑疑现拼接痕 视察称系古工艺与质料老化
  2. 东博会秘书处携中国味道“出海” 进东盟(印尼)专题展正式启幕
  3. 来自太空的祝福!黎家盈在空间站展示香港特戋戋旗庆回归29周年
  4. 在第四届链博会看“未来范儿”和“国际范儿”
  5. “夜赛龙舟”闹端午
  6. 创纪录!C罗一连6届天下杯破门
  7. 日本历史学者呼吁要把历史真相告诉给日今年轻一代
  8. 金观平:以高水平清静包管高质量生长
  9. 那不勒斯遇见重庆 意大利厨师串联起两地风味
  10. “侨瞧哈尔滨”启动 马来西亚侨商走进五??础暗尽被

相关推荐

【网站地图】