凯时AG

泉æºï¼šé‡åº†ä¸‡å·žå‘明大型砂金矿?????å‡çš„作者: æž—å­éºŸï¼š

DeepSeek陈德里AI论文第二弹:DeliAutoResearch SKILLåˆè¿›åŒ–了

机械之心编辑部

DeepSeek 研究员陈德里(Deli Chen)和 AI 相助的第二篇论文æ¥äº†ï¼

论文地点:https://victorchen96.github.io/continual_learning_survey.pdf

这篇论文èšç„¦continual learning(一连学习) 与 self-iteration(自我迭代)。。。ã€‚ã€‚åœ¨é™ˆå¾·é‡Œçœ‹æ¥ ï¼Œ,,这是 AI è¿ˆå‘ AGI 历程中æžä¸ºè¦å®³çš„一步

由于 arXiv ä¸å…许将 AI 列为作者 ,,,陈德里这次åªèƒ½æŠŠçŽ°å®žè‚©è´Ÿäº†è®ºæ–‡ 99% 事情é‡çš„ DeepSeek-V4-Pro (认真文字)和 GPT-Image-2(认真争åƒï¼‰ ,,,从作者æ ç§»è‡³è„šæ³¨è¯´æ˜Žã€‚。。。。

在这篇论文里 ,,,陈德里的判断是 ,,,未æ¥çš„ AI 系统ä¸ä¼šæ’ä¹…åœç•™åœ¨ä¸€ç»„å†»ç»“å‚æ•°çš„å½¢æ€ ï¼Œï¼Œï¼Œè€Œä¼šé€æ¸æ¼”å˜ä¸ºèƒ½å¤Ÿä¸€è¿žå­¦ä¹ ã€è‡ªæˆ‘æ›´æ–°ã€è‡ªæˆ‘迭代的系统

这背åŽçš„逻辑也很直接:上下文治ç†å’Œæ–‡æ¡£åŒ–影象 ,,,确实å¯ä»¥åœ¨ä¸€å®šæ°´å¹³ä¸Šèµ„助模å­ç»´æŒæ³¨é‡åŠ›ã€ä¿å­˜ä½¿å‘½å±¥åŽ†ã€‚。。。。但注é‡åŠ›çª—å£ç»ˆç©¶ä¼šè¢«å¡«æ»¡ ,,,到了è°äººæ—¶é—´ ,ï¼Œï¼Œå°±éœ€è¦æŠŠçŸ¥è¯†å’Œå±¥åŽ†å‚æ•°åŒ– ,,,以é™ä½Žè®¤çŸ¥è‚©è´Ÿã€‚。。。。

值得注é‡çš„æ˜¯ ,,,这ä¸ä½†æ˜¯ä¸€æ¬¡è®ºæ–‡ä¸»é¢˜ä¸Šçš„延伸 ,,,也是陈德里æ­å»ºçš„自主科研智能体框架 DeliAutoResearch SKILL自身的一次迭代实验。。。。。

泉æºï¼šhttps://x.com/victor207755822/status/2060315686329778432

æ®é™ˆå¾·é‡Œå…ˆå®¹ ,,,这一轮模拟å•行评审分数抵达了 8 分 ,,,相比上一篇论文的 6 åˆ†æœ‰æ˜¾ç€æå‡ã€‚。。。。更主è¦çš„æ˜¯ ,,,在这篇论文的天生历程中 ,,,模å­é¦–æ¬¡å®žéªŒæŒªç”¨æ›´é«˜çº§çš„è¯­è¨€æ¨¡å­ ï¼Œ,,自主设计并è¿è¡Œå®žéªŒ ,,,这也是此å‰ç‰ˆæœ¬å°šä¸å…·å¤‡çš„能力。。。。。

更能体现系统转å˜çš„ ,ï¼Œï¼Œæ˜¯è®ºæ–‡ä¸­æŠ«éœ²çš„ç”Ÿäº§æ•°æ®æ¯”照。。。。。陈德里在第二张图中比照了两篇论文的天生历程:从第一篇到第二篇:éšç€ SKILL 自己一直迭代 ,ï¼Œï¼Œäº¤äº’è½®æ•°å¤§å¹…ä¸‹é™ ï¼Œ,,而总 token æ¶ˆè€—æ˜¾è‘—ä¸Šå‡ ï¼Œ,,这å而是一个很是好的信å·ï¼å®ƒè¯´æ˜ŽSKILL æ­£åœ¨å‘æ›´é«˜è‡ªä¸»æ€§è½¬å˜

æ¢å¥è¯è¯´ ,,,人工介入å˜å°‘了 ,,,系统自己想和åšçš„部分å˜å¤šäº†ã€‚。。ã€‚ã€‚å¯¹ä¸€ä¸ªè‡ªåŠ¨ç§‘ç ”äº‹æƒ…æµæ¥è¯´ ,ï¼Œï¼Œè¿™æ°æ°æ˜¯èµ°å‘更高自主性的信å·ã€‚。。。。

陈德里体现很是期待在ä¸ä¹…çš„æœªæ¥ ï¼Œ,,DeliAutoResearch SKILL 能够真正产出巨匠级的学术写作。。。。。

ä¸è¿‡ ,,,他也å¦è¨€ ,,,在阅读论文的一些è¦å®³éƒ¨åˆ†åŽ ï¼Œ,,ä»èƒ½çœ‹åˆ°ä¸å°‘æå‡ç©ºé—´ã€‚。。。。

若是完全由自己亲自撰写 ,ï¼Œï¼Œè®ºæ–‡è´¨é‡æˆ–许会更高 ,,,但产出速率也会大幅下é™ã€‚。。ã€‚ã€‚ç”±äºŽç›®ä»Šçš„ç„¦ç‚¹ç›®çš„å¹¶ä¸æ˜¯æ‰“磨å•篇论文 ,,,而是一连迭代 DeliAutoResearch SKILL 自己 ,,,因此他选择ä¿å­˜è¿™ç¯‡è®ºæ–‡ä¸­ç•¥æ˜¾ç²—糙的部分 ,,,将其作为系统继续进化的å馈样本。。。。。

ä¸‹é¢ ï¼Œ,,我们æ¥çœ‹ä¸€çœ‹ ,,,这篇论文讲了什么。。。。。

为什么è¦ç»Ÿé€ä¸€è¿žå­¦ä¹ å’Œè‡ªæˆ‘刷新?????

论文æåˆ° ,ï¼Œï¼Œåœ¨å¤æ¿çš„研究中 ,,,一连学习和自我刷新往往被看æˆä¸¤ä¸ªå·®åˆ«ç ”ç©¶åå‘ ï¼Œ,,但它们é¢ä¸´çš„æ˜¯ç»Ÿä¸€ä¸ªåº•å±‚é—®é¢˜ï¼šæ¨¡å­æ€Žæ ·åœ¨å¸æ”¶æ–°ä¿¡æ¯æˆ–æ–°ç›®çš„ä¹‹åŽæ›´æ–°è‡ªå·± ,ï¼Œï¼ŒåŒæ—¶ä¸ç ´æŸå·²ç»æŽŒæ¡çš„能力?????

ä¸€è¿žå­¦ä¹ å…³æ³¨çš„æ˜¯æ¨¡å­æ€Žæ ·é¡ºåºé¡ºåº”新的使命或数æ®ï¼›ï¼›ï¼›ï¼› ï¼› ï¼›è‡ªæˆ‘åˆ·æ–°å…³æ³¨çš„æ˜¯æ¨¡å­æ€Žæ ·è‡ªä¸»å¢žå¼ºèƒ½åŠ›ã€‚。。。。但两者的手艺难点高度相似:都è¦åœ¨æ¼«è¡è½¬å˜ä¸‹ç¨³å›ºä¼˜åŒ– ,,,都è¦ä¿å­˜å·²æœ‰è¡¨å¾ ,,,都è¦å¤„ç†æŽ¢ç´¢ä¸Žä½¿ç”¨ä¹‹é—´çš„æƒè¡¡ ,,,也都è¦åœ¨æ²¡æœ‰ç‰¢é æµ‹è¯•集的情形下评估å‰è¿›ã€‚。。。。

å› æ­¤ ,,,作者以为 ,,,下一代 LLM è®­ç»ƒç®¡çº¿å¿…å®šä¼šæŠŠå¤–éƒ¨æ•°æ®æµå’Œæ¨¡å­è‡ªå¤©ç”Ÿè®­ç»ƒä¿¡å·è¿žç³»èµ·æ¥ ,,,形æˆç»†å¯†è€¦åˆçš„å馈循环。。。。。也就æ„å‘³ç€ ï¼Œ,,统一研究这两个åå‘䏿˜¯åˆ©ä¾¿ä¹‹ä¸¾ ,,,而是须è¦ä¹‹ä¸¾ã€‚。。。。

焦点å­é¡ºä¸€ï¼šæå‡ºäº†ä¸€ä¸ªä¸‰è½´ç»Ÿä¸€åˆ†ç±»æ¡†æž¶

这篇论文最主è¦çš„å­é¡ºä¹‹ä¸€æ˜¯æå‡ºäº†é¦–ä¸ªåŒæ—¶ç¬¼ç½©å¤§è¯­è¨€æ¨¡å­ä¸€è¿žå­¦ä¹ ä¸Žè‡ªæˆ‘刷新的分类框架 ,,,并将其组织在三个相互正交的维度上:

更新什么:å³è¢«æ›´æ–°çš„æ˜¯çŸ¥è¯†ã€æ‰‹è‰ºã€å¯¹é½èƒ½åŠ›ç…§æ—§æŽ¨ç†èƒ½åŠ›ï¼›ï¼›ï¼›ï¼› ï¼› ï¼›æ€Žæ ·æ›´æ–°ï¼šå³æŽ¥çº³å“ªä¸€ç±»è¦é¢†ï¼›ï¼›ï¼›ï¼› ï¼› ï¼›ä½•æ—¶æ›´æ–°ï¼šå³æ›´æ–°çˆ†å‘在离线阶段ã€å‘¨æœŸæ€§é˜¶æ®µã€åœ¨çº¿é˜¶æ®µ ,,,照旧由特定事务触å‘。。。。。

这个三轴框架如下图所示 ,,,能够对任何安排åŽçš„学习系统举行准确æç»˜ ,,,并展现差别è¦é¢†ä¹‹é—´æ­¤å‰æœªè¢«å……分熟悉到的è”系。。。。。

焦点å­é¡ºäºŒï¼šå¯¹äº”概略领ç§åˆ«ä¸¾è¡Œäº†ç³»ç»Ÿå‰–æž

论文系统剖æžäº† 100 多篇论文 ,,,并将其归纳为五类è¦é¢†ï¼šåŸºäºŽæ­£åˆ™åŒ–的一连学习ã€å›žæ”¾ä¸Žå±¥åŽ†æ²»ç†ã€å‚数高效与?????榛è‡â’†æ™•宜⑿掠胱圆┺ ,,,以åŠåœ¨çº¿è‡ªé¡ºåº”è¦é¢†ã€‚。。。。关于æ¯ä¸€ç±»è¦é¢† ,,,都形å¼åŒ–形貌其焦点机制 ,,,剖æžå…¶ç†è®ºæ€§å­ ,,,并较é‡ä»£è¡¨æ€§è¦é¢†ã€‚。。。。

焦点å­é¡ºä¸‰ï¼šå½¢å¼åŒ–æç»˜äº†è‡ªæˆ‘刷新的收敛æ¡ä»¶

论文对迭代å¼è‡ªæˆ‘刷新在什么æ¡ä»¶ä¸‹èƒ½å¤ŸåŒ…ç®¡æ”¶æ•›è€Œä¸æ˜¯å‘散举行了形å¼åŒ–å‰–æž ï¼Œ,,并未æ¥è‡ªè‡ªåšå¼ˆã€è¿­ä»£è’¸é¦å’Œ Constitutional AI 等研究åå‘ä¸­ç–æ•£çš„ç†è®ºæ•ˆæžœ ,,,统一到统一个框架之下。。。。。

论文以为 ,,,自我刷新代表了一ç§èŒƒå¼è½¬å˜ï¼šæ¨¡å­èƒ½åŠ›æå‡æ­£åœ¨ä»Žä¾èµ–人类监视 ,,,转å‘由模å­è‡ªä¸»é©±åŠ¨ã€‚。。。。所æåŠçš„è¦é¢†ç¬¼ç½©äº†ä¸€ä¸ªå¾ˆå®½çš„规模:从训练阶段的自åšå¼ˆ ,ï¼Œï¼Œé€šè¿‡å¤šè½®è¿­ä»£ä¿®æ”¹æ¨¡å­æƒé‡ï¼›ï¼›ï¼›ï¼› ï¼› ;到推ç†é˜¶æ®µçš„æŽ¨ç†å¢žå¼º ,,,æå‡æ¯ä¸€æ¬¡å•独展望的质é‡ï¼›ï¼›ï¼›ï¼› ï¼› ï¼›å†åˆ°ç†è®ºå‰–æž ï¼Œ,,划定自我刷新事实能够抵达什么界线……

这些è¦é¢†çš„é…åˆç‚¹åœ¨äºŽ ,ï¼Œï¼Œå®ƒä»¬éƒ½éœ€è¦æŸç§ grounding signal ,,,å³å¯é çš„锚定信å·ã€‚。。。。这个信å·å¯ä»¥æ˜¯éªŒè¯å™¨ã€ä¸€å¥—宪法原则ã€äººç±»åå¥½æ•°æ® ï¼Œ,,也å¯ä»¥æ˜¯é—®é¢˜è‡ªå·±çš„结构。。。ã€‚ã€‚æ²¡æœ‰è¿™æ ·çš„é”šå®šä¿¡å· ï¼Œ,,自我刷新的循环最终必定会退化。。。。。

如下图所示 ,,,自我刷新的轨迹并ä¸å–决于天生气制有多é‡å¤§ ,,,而å–决于评估信å·çš„è´¨é‡ ï¼Œ,,以åŠå®ƒç›¸å…³äºŽæ¨¡å­è‡ªèº«çš„自力性。。。。。

焦点å­é¡ºå››ï¼šæå‡ºå…­ä¸ªå¼€æ”¾æŒ‘战

åœ¨æœ€åŽ ï¼Œï¼Œï¼Œè®ºæ–‡æŒ‡å‡ºäº†å¤©ç”Ÿå¼æ¨¡å­ä¸€è¿žå­¦ä¹ èµ°å‘æˆç†ŸåŽ†ç¨‹ä¸­ ,,,亟待解决的六个è¦å®³é—®é¢˜ ,ï¼Œï¼Œå¹¶åŸºäºŽç³»ç»Ÿå‰–æžæ‰€å±•现的研究空缺 ,,,为æ¯ä¸ªé—®é¢˜æå‡ºäº†æœªæ¥ç ”ç©¶åå‘。。。。。

大模å­è§„模能å¦è§£å†³ç¾é𾿀§é—忘:更大的模å­ç¡®å®žå¯èƒ½æ›´ç¦æ­¢æ˜“é—忘 ,ï¼Œï¼Œä½†è§„æ¨¡ä¸æ˜¯æ ¹æ²»æ–¹æ¡ˆã€‚。。。。éšç€ä½¿å‘½ä¸€è¿žå¢žæ·» ,,,纵然大模å­ä¹Ÿä¼šé‡åˆ°å®¹é‡ã€æ»‹æ‰°å’Œå¯¹é½æ¼‚移问题。。。。。未æ¥éœ€è¦ç ”究的是 ,,,大模å­è§„模怎样影å“稳固性 — å¯å¡‘性æƒè¡¡ ,ï¼Œï¼Œä»¥åŠæ˜¯å¦ä¿å­˜å¯å±•望的 Scaling Law。。。。。

自我刷新的ç†è®ºæžé™ï¼šæ¨¡å­èƒ½å¦æ— é™è‡ªæˆ‘æå‡?????什么时间会收敛?????什么时间会å塌?????论文以为这是焦点ç†è®ºé—®é¢˜ã€‚。。。。尤其是在缺少外部验è¯å™¨çš„语言使命中 ,,,模å­å¾ˆå®¹æ˜“陷入自我确认:它会一直强化自己已ç»ç›¸ä¿¡çš„æ¨¡å¼ ,,,而纷歧定更é è¿‘真实目的。。。。。

多模æ€ä¸€è¿žå­¦ä¹ ï¼šæœªæ¥æ¨¡å­ä¸ä½†å¤„ç†æ–‡æœ¬ ,,,还会处ç†å›¾åƒã€éŸ³é¢‘ã€è§†é¢‘和行动数æ®ã€‚。。ã€‚ã€‚å¤šæ¨¡æ€æ¨¡å­ä¸€è¿žå­¦ä¹ æ—¶ ,,,一个模æ€çš„æ›´æ–°å¯èƒ½å½±å“å¦ä¸€ä¸ªæ¨¡æ€ã€‚。。。。例如更新视觉天生能力 ,,,å¯èƒ½å½±å“语言明确;;;; ï¼› ï¼›æ›´æ–°è¯­è¨€å¯¹é½ ï¼Œ,,也å¯èƒ½å½±å“图åƒå¤©ç”Ÿè¡Œä¸ºã€‚。。。。怎样跨模æ€ä¿å­˜èƒ½åŠ› ,,,是未æ¥ç ”究中需è¦è§£å†³çš„难题。。。。。

清é™çš„一连对é½ï¼šæ¨¡å­ä¸€è¿žå­¦ä¹ æ—¶ ,,,清é™ç•Œçº¿ä¹Ÿå¿…éœ€ä¸€è¿žåšæŒ ,,,å¯é—®é¢˜åœ¨äºŽ ,,,任何更新都å¯èƒ½å‰Šå¼±åŽŸæœ‰å¯¹é½èƒ½åŠ›ã€‚。。。。因此 ,,,论文以为 ,,,未æ¥éœ€è¦ã€Œå¯è¯å®žæ¸…é™ã€çš„ä¸€è¿žå¯¹é½æœºåˆ¶ï¼šæ¨¡å­å˜å¾—æ›´å¼ºçš„åŒæ—¶ ,,,清é™çº¦æŸä¸å¯è¢«é—忘或绕过。。。。。

安排时「实时学习ã€ï¼šå®žæ—¶æœåŠ¡è¦æ±‚低延迟和高稳固性 ,,,而在线学习需è¦ç›˜ç®—æ¢¯åº¦ã€æ›´æ–°å‚æ•°ã€éªŒè¯è´¨é‡ã€é˜»æ­¢å›žå½’ç­‰ ,,,这两者「自然冲çªã€ã€‚。。。。因此 ,,,真实安排中需è¦è®¾è®¡åˆ†å±‚更新机制:哪些转å˜å³æ—¶å¤„ç†?????哪些转å˜å»¶è¿Ÿæ‰¹å¤„ç†?????哪些转å˜å¿…需ç»ç”±æ¸…é™å®¡æŸ¥åŽæ‰åŽè¿›å…¥å‚æ•°?????

与 Agent 框架连系:智能体会在æ’久使命中积累履历 ,,,好比工具挪用效果ã€å¤±è´¥æ•™è®­ã€ç”¨æˆ·åå¥½ã€æƒ…å½¢å馈等。。。。。问题是:什么时间把短期履历写入æ’久影象????ï¼Ÿä»€ä¹ˆæ—¶é—´åº”è¯¥æ›´æ–°å‚æ•°????ï¼Ÿå“ªäº›å±¥åŽ†åªæ˜¯æ— æ„事务 ,,,哪些履历代表稳固纪律?????

论文以为 ,,,未æ¥éœ€è¦å±‚级影象架构 ,,,让 Agent åŒæ—¶æ‹¥æœ‰çŸ­æœŸæƒ…节影象和æ’久傿•°çŸ¥è¯† ,,,也需è¦å¤šæ™ºèƒ½ä½“一连学习机制 ,,,让多个 Agent 共享并整åˆå±¥åŽ†ã€‚。。。。

æœ€åŽ ï¼Œ,,论文的焦点判断是:一连学习和自我刷新正在走å‘èžåˆã€‚。。。。真正有远景的åå‘ ï¼Œï¼Œï¼Œæ˜¯æž„å»ºè¿™æ ·ä¸€ç§æ¨¡å­ï¼šå®ƒæ—¢èƒ½å¸æ”¶å¤–部天下的新知识 ,ï¼Œï¼Œä¹Ÿèƒ½ä½¿ç”¨è‡ªæˆ‘åæ€ã€è‡ªæˆ‘验è¯å’Œè‡ªæˆ‘æœç´¢æ¥åˆ·æ–°å­¦ä¹ æˆ˜ç•¥ï¼›ï¼›ï¼›ï¼› ï¼› ;既能å˜å¾—更强 ,,,åˆèƒ½åšæŒç¨³å›ºä¸Žæ¸…é™ã€‚。。。。

简言之就是 ,,,ä¸ä½†æ˜¯è®­ç»ƒå¾—更大 ,,,而是能ä¸å¯åœ¨ä¸é—忘ã€ä¸å¤±æŽ§çš„æ¡ä»¶ä¸‹ ,,,一连学习ã€ä¸€è¿žå¯¹é½ã€ä¸€è¿žè‡ªæˆ‘进化……

那么你呢 ,,,怎样看待这篇「AI 写的论文〠,,,接待在谈论区留言ã€äº¤æµï¼

https://x.com/victor207755822/status/2060315686329778432

https://victorchen96.github.io/continual_learning_survey.pdf

@赖宜å›ï¼š66m66威九国际成长模式 ,ï¼Œï¼Œå‰æž—白山4179å考生加入高考
@陈书易:ç¥å°‘年的你今å¤åœ†æ¢¦ 未æ¥å¯æœŸ
@许舒宜:俄称阻挡乌军无人机乌称攻击俄目的

ã€ç½‘站地图】