凯时AG

泉æºï¼šä»Žå¤©ä¸‹æœŸå¾…中感å—中美元首外交的分é‡ä½œè€…: å¶å¿—鸿:

Mind Lab一连宣布LoRA最新希望,,,大模å­ã€Œä¸€è¿žå­¦ä¹ ã€æ–°èŒƒå¼æµ®çް

机械之心宣布

最近,ï¼Œï¼Œå‰æ²¿å®žéªŒå®¤ Mind Lab 麋集宣布了一系列关于 LoRA 与 PEFT(高效微调)的研究效果,,,似乎æç»˜å‡ºäº†å¦ä¸€æ¡å¤§æ¨¡å­ã€Œä¸€è¿žå­¦ä¹ ã€çš„路径。。。。。。

在 Mind Lab 的视角中,,,PEFT ä¸å†æ˜¯å¯¹å¤§æ¨¡å­å…¨å‚æ•°åŽè®­ç»ƒçš„一ç§å»‰ä»·å¹³æ›¿,,,更是实现从 “基础模å­â€ å‘ â€œå¯ä¸€è¿žå­¦ä¹ æ™ºèƒ½ä½“†过渡的焦点架构机制。。。。。。

链接:https://x.com/HuggingPapers/status/2054431768779067542?s=20

通过构建一æ¡å®Œæ•´çš„æ‰‹è‰ºé“¾è·¯,,,涵盖影象架构(δ-mem)ã€åº•层基础设施(MinTï¼‰ã€æ‰©å±•定律(Scaling of PEFT)以åŠå¤©ç”Ÿå¼ UI 应用(Macaron-A2UI),,,Mind Lab 正在æç»˜ä¸€ä¸ªå¼˜å¤§çš„æ„¿æ™¯ï¼šè®©å°‘å°‘æ•°å¼ºç››çš„ä¸‡äº¿å‚æ•°åŸºç¡€æ¨¡å­,,,支æŒèµ·æ•°ä»¥ç™¾ä¸‡è®¡çš„ã€å…·å¤‡è‡ªåŠ›å½±è±¡å’Œæ‰‹è‰ºçš„å¯ä¸€è¿žå­¦ä¹ æ™ºèƒ½ä½“。。。。。。

基于 LoRA 的线性注é‡åŠ›æž¶æž„ï¼šÎ´-mem 在线影象机制

夿¿ Transformer çš„ KV cache åªæ˜¯æŽ¨ç†åŽ†ç¨‹ä¸­çš„å†»ç»“ç¼“å­˜,,,纪录的是目今上下文的中心状æ€,,,自己ä¸ä¼šéšç€äº¤äº’一连学习。。。。。ã€‚ä¸ºäº†è®©æ™ºèƒ½ä½“æ‹¥æœ‰å¯æ›´æ–°çš„一连影象,,,Mind Lab 针对 LoRA çš„ç‰¹å¾æå‡ºäº†ç«‹å¼‚çš„å¹³è¡Œæ··æ·†çº¿æ€§æ³¨é‡åŠ›æž¶æž„ δ-mem。。。。。。

正如多家媒体报é“的那样:仅仅使用一个 8×8 的在线影象状æ€ï¼ˆå‚数增添低至 0.12%),,,δ-mem 就能让模å­åœ¨ Memory Agent Bench å’Œ LoCoMo ç­‰é‡åº¦å½±è±¡åŸºå‡†æµ‹è¯•中获得高达 1.31 å€å’Œ 1.20 å€çš„æ€§èƒ½æå‡。。。。。。纵然移除了显å¼çš„历å²ä¸Šä¸‹æ–‡,,,它ä¾ç„¶èƒ½æ¢å¤å‡ºå¤§å®—相关信æ¯。。。。。。

链接:https://venturebeat.com/orchestration/a-0-12-parameter-add-on-gives-ai-agents-the-working-memory-rag-cant?utm_source=devbytes&utm_medium=androidapp&utm_campaign=fullarticle

ä¸Žå¤æ¿ä¾èµ–æ‰©å±•ä¸Šä¸‹æ–‡çª—å£æˆ–外部文本检索的工程方å¼å·®åˆ«,,,δ-mem æ·±å…¥åˆ°å‚æ•°å±‚举行优化,,,将冻结的全注é‡åŠ›ä¸»å¹²ç½‘ç»œä¸Žä¸€ä¸ªç´§å‡‘çš„åœ¨çº¿å…³è”影象状æ€ï¼ˆOnline State of Associative Memory)连系起æ¥。。。。。。

一å reddit 网å‹åœ¨è®ºæ–‡å®£å¸ƒä¹‹åŽå¿«é€Ÿå°† δ-mem 集æˆåˆ°è‡ªå·±çš„å°é¾™è™¾ä¸­,,,获得了 agent 在影象体现上的æå‡ï¼š

链接:https://www.reddit.com/r/LocalLLaMA/comments/1tf68yo/i_fitted_the_new_% CE% B4mem_research_for_apple_silicon/

δ-mem 会éšç€ Token 的输入,,,使用增é‡è§„则(delta-rule learning)一连更新一个牢é å·¨ç»†çš„矩阵。。。。。。在天生时,,,系统会从该状æ€ä¸­è¯»å®ˆä¿¡å·,,,对主干网络的 Attention Query å’Œ Output 施加低秩校正(low-rank corrections)。。。。。。

X ç½‘å‹ Dan 赞å¹é“:这就是 continual learning 的未æ¥ï¼

链接:https://x.com/daniel_mac8/status/2055740325822333419?s=20

LoRA Infra:百万级 LLM 的训练与æœåŠ¡åŸºå»º (MinT)

基于模å­ä¸€è¿žå­¦ä¹ æ‰€æ‰“造的 agent 产å“éœ€è¦æ–°çš„基础设施,,,Mind Lab 给出了他们的谜底 MinT。。。。。。

什么是 MinT,,, 我们å¯ä»¥å…ˆçœ‹ X ç½‘å‹ Awais 的解读。。。。。。

泉æºï¼šhttps://x.com/drawais_ai/status/2056301110906757464?s=20

简朴æ¥è®²ï¼šMinT 是一个专为 LoRA 训练和在线æœåŠ¡æ‰“é€ çš„æ‰˜ç®¡åŸºç¡€è®¾æ–½ç³»ç»Ÿ。。。。。。

在 δ-mem 中æåˆ°,,,差别的人ã€å·®åˆ«çš„æ–¹å¼ä½¿ç”¨ agent,,,将会形æˆå·®åˆ«çš„影象状æ€,,,LoRA 也åŒç†,ï¼Œï¼Œæ²»ç† LoRA å¹¶éžæ²»ç†å•个模å­,,,是治ç†ä¸€å¤§ç¾¤æ¨¡å­çš„å˜ä½“。。。。。。

æ¯ä¸ª LoRA 都有自己的版本ã€è‡ªå·±çš„训练曲线ã€è‡ªå·±çš„å›žæ»šç‚¹ã€æ›´ä¸»è¦çš„æ˜¯è¿™ä¸ª LoRA å¯èƒ½æ­£åœ¨è¢«æŸä¸ªç”¨æˆ·ä½¿ç”¨ç€。。。。。ã€‚æ”¯æŒæ¨¡å­åŽè®­ç»ƒåœ¨çœŸå®žåœºæ™¯ä¸­ä¸€è¿žå­¦ä¹ è¿™ä»¶äº‹è¦å»ºè®¾,,,必需有一套基础设施能够治ç†è¿™ä¹ˆå¤šæ°”概å„异的 LoRA。。。。。。

MinT æŠŠåŸºç¡€æ¨¡å­æ’ä¹…ä¿ä¿å­˜è®­ç»ƒå’ŒæŽ¨ç†æœåС䏭。。。。。。一步训练竣事åŽ,ï¼Œï¼Œç³»ç»Ÿå¯¼å‡ºçš„ä¸æ˜¯å®Œæ•´æ¨¡å­,,,而是一份很å°çš„ LoRA Adapter。。。。。。评估ã€ä¸Šçº¿å’Œå›žæ»šæ—¶,,,MinT 也åªç§»åŠ¨å’ŒåŠ è½½è¿™ä»½ adapter。。。。。。

这样,,,上线一个新战略ä¸éœ€è¦æŠŠ LoRA åˆå¹¶è¿›å®Œæ•´æ¨¡å­,,,也ä¸éœ€è¦é‡æ–°åŠ è½½ä¸€ä»½å®Œæ•´æ¨¡å­。。。。。ã€‚ç³»ç»ŸåªæŠŠæ–°çš„ adapter 接到已ç»å¸¸é©»çš„基础模å­ä¸Š。。。。。。Adapter 的文件巨细通常ä¸åˆ°åŸºç¡€æ¨¡å­çš„ 1%(在 rank-1 设置下å¯é™åˆ°çº¦ 0.1%)。。。。。。在现实丈é‡ä¸­,,,从训练完æˆåˆ°æŽ¨ç†æœåŠ¡å¯ç”¨çš„交接时间,,,最多å¯ç¼©çŸ­ 18.3 å€。。。。。。

MinT å°†é•¿æœŸåŒ–çš„æˆ˜ç•¥ç›®å½•ï¼ˆæˆ–è€…è¯´æµ·é‡ LoRA 集)与 CPU/GPU çš„çƒ­äº‹æƒ…é›†ç–æ•£,ï¼Œï¼Œæ”¯æŒ ä»¥ä¸Šçº§åˆ«çš„æˆ˜ç•¥å¯»å€。。。。。。针对冷å¯åŠ¨åŠ è½½çš„ç“¶é¢ˆ,,,MinT 通过打包 MoE LoRA å¼ é‡,,,去除了大宗å°å·¥å…·çš„读写风暴,,,使引擎的实时加载速率æå‡äº† 8.5 至 8.7 å€。。。。。。

Packing è§£å†³çš„æ˜¯å•æ¬¡å†·åŠ è½½é—®é¢˜ ï¼›;;;为消除新增 LoRA 的冷加载对在线æµé‡çš„æ»‹æ‰°,,,MinT 进一步引入二阶段 rollout:先在 admission 控制下完æˆé¢„热,,,使 LoRA 仅在åœå½“åŽæ‰å¯¹ç”¨æˆ·æµé‡å¯è§。。。。。。在混淆负载测试下,,,该机制将用户å¯è§çš„ LoRA 加载 p95 é™è‡³ 0ã€é¦–请求 TTFT p95 缩短 2.3 å€。。。。。。

LoRA 的三大扩展轴:On the Scaling of PEFT

泉æºï¼šhttps://x.com/HuggingPapers/status/2056021071862575448?s=20

Mind Lab 还宣布了关于 LoRA 的研究论文 On the Scaling of PEFT,,,针关于 base model 能够 serve 百万个 LoRA 模å­çš„å¯è¡Œæ€§æå‡ºäº†ä¸‰å¤§åŸºäºŽ LoRA 的扩展轴:

第一个扩展轴:Scale up

强盛的基础模å­èƒ½è®©ç»†å°çš„æ›´æ–°çˆ†å‘é‡å¤§çš„æ æ†æ•ˆåº”。。。。。ã€‚ç›´è§‰ä¸Šæ›´å¤§å‚æ•°èƒ½å¤Ÿè®©æ¨¡å­æ‹¥æœ‰æ›´å¼ºçš„能力,,,在基础上训练的 LoRA 也会有更强的体现。。。。。。

1T 规模的希罕 MoE 上举行 LoRA 强化学习并éžå®¹æ˜“之事,,,由于 MoE 在训练和推ç†åŽ†ç¨‹ä¸­ä¸“å®¶çš„æ¿€ç”Ÿè·¯å¾„å·®åˆ«ä¼šçˆ†å‘严é‡çš„训推纷歧致的å¾è±¡。。。。。。在 scale up 的历程中,,,Mind Lab 呿˜Žäº†çŽ°æœ‰è·¯ç”±é‡æ”¾ï¼ˆRouter Replayï¼‰æœºåˆ¶åœ¨å‰æ²¿ MoE 模å­ä¸Šå¤±æ•ˆåŽŸå› å¹¶æå‡ºå“应修正以消除训练和推ç†çš„差别。。。。。。

第二个扩展轴:Scale down

LoRA rank 决议 RL 适é…的表达能力强弱。。。。。。业界通常把 rank 设在 16–32,,,以求更稳的训练和推ç†。。。。。。但è¦åŒæ—¶æœåŠ¡ä¸Šç™¾ä¸‡æ¨¡å­,,,rank 还得继续压到 16 以下,,,并且性能ä¸å¯æŽ‰。。。。。。

得益于 MinT adapter 的架构,,,Mind Lab 通过了一ç§åŽŸç”ŸäºŽ RL çš„åˆå§‹åŒ–è¦é¢†OLoRA-tail。。。。。。将 LoRA scale down 到了æžè‡´。。。。。。该è¦é¢†ä½¿ç”¨é¢„训练æƒé‡çš„æ¬¡è¦å¥‡å¼‚å‘é‡ï¼ˆminor singular vectors)举行åˆå§‹åŒ–,,,并移除了å¯èƒ½å¯¼è‡´å¼ºåŒ–学习ä¸ç¨³å›ºçš„奇异值缩放因å­,,,在ä¸å¢žæ·»å‚数目的æ¡ä»¶ä¸‹,,,大幅æå‡äº† Rank-1 适é…器的稳固性与性能。。。。。。

第三个扩展轴:Scale out

MinT 让上百个 LoRA adapter åŒæ—¶åœ¨çº¿,,,"æ¨¡å­æ•°ç›®" æˆäº†å¯æŽ§çš„ scaling å˜é‡。。。。。。

模å­çš„多样性从何而æ¥ï¼Ÿ???与 δ-mem 一脉相承,,,Mind Lab æå‡ºäº† LoRA as Memory 的看法并è¯å®ž LoRA 容é‡çº¦ tokens/param,ï¼Œï¼Œæ˜¯ä¸€ç§æœ‰é™ä»‹è´¨,,,应留给 skillã€persona 等长期行为状æ€è€Œéžå¯ç¼–辑事实,ï¼Œï¼Œä»¥é¡ºåº”åº•åº§æ¨¡å­æ¼«è¡å¤–的使命 ï¼›;;;这ç§ä¸€è¿žå­¦ä¹ ç”± Context Learning 完æˆ,,,让差别的 adapter 沿差别路径分化。。。。。。

近期美团ã€é˜¿é‡Œçš„研究也指å‘统一åå‘,,,LoRA RL 内化的手艺能够为难题使命涤讪认知基础,,,体现显著优于 skill 或 context,,,且 LoRA èƒ½ä»¥å°‘å°‘å‚æ•°é«˜æ•ˆè£…下结构化事实,,,形æˆå·®åˆ«åŒ–的稳固模å­。。。。。。

è¿™ç§å·®åˆ«åœ¨èšé€‚时被兑现,,, å¤§éƒ½æŠ•ç¥¨ä¸‹å‡†ç¡®çŽ‡éšæ¨¡å­æ•°ç›® k 泛起出履历上的对数增添定律()。。。。。。这也是在三个扩展轴上涌现出æ¥çš„ã€åŸºäºŽæ¨¡å­æ•°ç›®çš„ scaling law。。。。。。

Macaron-A2UI:走å‘å¤©ç”Ÿå¼ UI 的智能交互

ä¸ä½†æ˜¯ç†è®º,,,Mind Lab 也试验性地宣布了一个基于 MinT 训练出æ¥çš„æ¨¡å­Macaron-A2UI

他们自己的形貌是:纯文本对è¯åœ¨å¤„ç†é‡å¤§çš„用户使命时ä¿å­˜è®¤çŸ¥è´Ÿè·é«˜ã€æµç¨‹ç¹ç的瓶颈。。。。。。为此,,,Mind Lab 基于 MinT 训练了凭è¯ç”¨æˆ·ä¸“å±žä¹ æƒ¯ä¸€è¿žå­¦ä¹ çš„å¤©ç”Ÿå¼ UI æ¨¡å­ Macaron-A2UI。。。。。。

模å­ä¸ä½†ä»…输出文本,,,还能在实时交互中天生结构化的 A2UI 坿‰§è¡Œè¡ŒåŠ¨ï¼ˆå¦‚å¤šé€‰æ¡†ã€æ»‘å—ã€ç¡®è®¤å¡ç‰‡ç­‰ï¼‰。。。。。。

Macaron-A2UI 的训练历程也是诠释了 Mind Lab 上é¢çš„一系列ç†è®ºï¼šåœ¨ 30B,,,235B å’Œ 754B 的大语言模å­åº•座上,,,基于 MinT å¹³å°,,,团队先使用基于 LoRA çš„ SFT(监视微调)建设文本到 UI 的对é½,,,éšåŽä½¿ç”¨ GRPO 强化学习æå‡å¯æ‰§è¡Œäº¤äº’的质é‡。。。。。。

在æžå…¶è½»é‡çº§çš„ Schema æé†’下,,,体现最好的 Macaron-A2UI-Venti 模å­åœ¨ A2UI-Bench 上斩获了 75.6 的综åˆé«˜åˆ†,,,甚至逾越了输入了完整冗长 Schema(长度约为 27 å€ï¼‰ æé†’çš„æœ€å¼ºå‰æ²¿æ¨¡å­åŸºçº¿。。。。。。这è¯å®žæ™°é‡å¤§çš„ UI 天生能力完全å¯ä»¥é€šè¿‡é«˜æ•ˆå¾®è°ƒè¢«å†…åŒ–åˆ°æ¨¡å­æƒé‡ä¸­。。。。。。

从现在通用模å­çš„痛点出å‘,,,Mind Lab 打造了能够在线一连学习的 δ-memã€é¢å‘百万 LoRA 模å­çš„训推基础设施 MinT ä»¥åŠ LoRA Scaling Law ç†è®º。。。。。。从最新宣布的 A2UI 模å­,ï¼Œï¼Œåˆ°ä¸€ç›´åšæŒçš„一连学习研究åå‘,,,Mind Lab 冿¬¡å±•示了从应用ã€ç³»ç»Ÿåˆ°ç†è®ºçš„研究纵深。。。。。。

æ®æ‚‰,,,Mind Lab çš„æ‰€å±žå…¬å¸æ˜¯ Mindverse(心洲科技)。。。。。。这家中国原生的 Neo Lab 跑通了一æ¡ä½Žæœ¬é’±é«˜æ”¶ç›Šçš„一连学习之路,,,正如其论文所æç»˜çš„那样,,,未æ¥çš„ AI æž¶æž„æˆ–è®¸æ­£æ˜¯äº‘äº‘ï¼šå°‘æ•°å‡ ä¸ªå¼ºç››çš„ä¸‡äº¿å‚æ•°åŸºç¡€æ¨¡å­,,,支æŒèµ·æ•°ç™¾ä¸‡ä¸ªå‚æ•°ç›®æžå°ä½†å…·æœ‰è‡ªåŠ›ä¸ªæ€§ã€å½±è±¡å’Œ UI 交互能力的å¯ä¸€è¿žå­¦ä¹ æ™ºèƒ½ä½“。。。。。。

@å¶é˜³ç­ ï¼šky8018开元,,,中美元首会晤释放了哪些主è¦ä¿¡å·
@陈信æ„:女å­åœ¨åšç‰©é¦†çœ‹åˆ°â€œé—ºèœœâ€äº†
@æŽå§¿å©·ï¼šè€èµ–获130万å´ä¸è¿˜27万欠款 获刑åŠå¹´

ã€ç½‘站地图】