Mind Lab一连宣布LoRA最新希望,,,大模å「一连å¦ä¹ ã€æ–°èŒƒå¼æµ®çް
机械之心宣布
æœ€è¿‘ï¼Œï¼Œï¼Œå‰æ²¿å®žéªŒå®¤ Mind Lab 麋集宣布了一系列关于 LoRA 与 PEFTï¼ˆé«˜æ•ˆå¾®è°ƒï¼‰çš„ç ”ç©¶æ•ˆæžœï¼Œï¼Œï¼Œä¼¼ä¹Žæç»˜å‡ºäº†å¦ä¸€æ¡å¤§æ¨¡å「一连å¦ä¹ ã€çš„路径。。。。。。
在 Mind Lab 的视角ä¸ï¼Œï¼Œï¼ŒPEFT ä¸å†æ˜¯å¯¹å¤§æ¨¡å免傿•°åŽè®ç»ƒçš„一ç§å»‰ä»·å¹³æ›¿ï¼Œï¼Œï¼Œæ›´æ˜¯å®žçŽ°ä»Ž “基础模åâ€ å‘ â€œå¯ä¸€è¿žå¦ä¹ 智能体†过渡的焦点架构机制。。。。。。
链接:https://x.com/HuggingPapers/status/2054431768779067542?s=20
通过构建一æ¡å®Œæ•´çš„æ‰‹è‰ºé“¾è·¯ï¼Œï¼Œï¼Œæ¶µç›–影象架构(δ-mem)ã€åº•层基础设施(MinTï¼‰ã€æ‰©å±•定律(Scaling of PEFT)以åŠå¤©ç”Ÿå¼ UI 应用(Macaron-A2UI),,,Mind Lab æ£åœ¨æç»˜ä¸€ä¸ªå¼˜å¤§çš„æ„¿æ™¯ï¼šè®©å°‘å°‘æ•°å¼ºç››çš„ä¸‡äº¿å‚æ•°åŸºç¡€æ¨¡å,,,支æŒèµ·æ•°ä»¥ç™¾ä¸‡è®¡çš„ã€å…·å¤‡è‡ªåŠ›å½±è±¡å’Œæ‰‹è‰ºçš„å¯ä¸€è¿žå¦ä¹ 智能体。。。。。。
基于 LoRA 的线性注é‡åŠ›æž¶æž„ï¼šÎ´-mem 在线影象机制
夿¿ Transformer çš„ KV cache åªæ˜¯æŽ¨ç†åŽ†ç¨‹ä¸çš„冻结缓å˜ï¼Œï¼Œï¼Œçºªå½•的是目今上下文的ä¸å¿ƒçжæ€ï¼Œï¼Œï¼Œè‡ªå·±ä¸ä¼šéšç€äº¤äº’一连å¦ä¹ ã€‚ã€‚ã€‚ã€‚ã€‚ã€‚ä¸ºäº†è®©æ™ºèƒ½ä½“æ‹¥æœ‰å¯æ›´æ–°çš„一连影象,,,Mind Lab 针对 LoRA çš„ç‰¹å¾æå‡ºäº†ç«‹å¼‚çš„å¹³è¡Œæ··æ·†çº¿æ€§æ³¨é‡åŠ›æž¶æž„ δ-mem。。。。。。
æ£å¦‚多家媒体报é“çš„é‚£æ ·ï¼šä»…ä»…ä½¿ç”¨ä¸€ä¸ª 8×8 的在线影象状æ€ï¼ˆå‚数增添低至 0.12%),,,δ-mem 就能让模å在 Memory Agent Bench å’Œ LoCoMo ç‰é‡åº¦å½±è±¡åŸºå‡†æµ‹è¯•ä¸èŽ·å¾—é«˜è¾¾ 1.31 å€å’Œ 1.20 å€çš„æ€§èƒ½æå‡ã€‚。。。。。纵然移除了显å¼çš„历å²ä¸Šä¸‹æ–‡ï¼Œï¼Œï¼Œå®ƒä¾ç„¶èƒ½æ¢å¤å‡ºå¤§å®—相关信æ¯ã€‚。。。。。
链接:https://venturebeat.com/orchestration/a-0-12-parameter-add-on-gives-ai-agents-the-working-memory-rag-cant?utm_source=devbytes&utm_medium=androidapp&utm_campaign=fullarticle
ä¸Žå¤æ¿ä¾èµ–æ‰©å±•ä¸Šä¸‹æ–‡çª—å£æˆ–外部文本检索的工程方å¼å·®åˆ«ï¼Œï¼Œï¼ŒÎ´-mem æ·±å…¥åˆ°å‚æ•°å±‚举行优化,,,将冻结的全注é‡åŠ›ä¸»å¹²ç½‘ç»œä¸Žä¸€ä¸ªç´§å‡‘çš„åœ¨çº¿å…³è”影象状æ€ï¼ˆOnline State of Associative Memory)连系起æ¥ã€‚。。。。。
一å reddit 网å‹åœ¨è®ºæ–‡å®£å¸ƒä¹‹åŽå¿«é€Ÿå°† δ-mem 集æˆåˆ°è‡ªå·±çš„å°é¾™è™¾ä¸ï¼Œï¼Œï¼ŒèŽ·å¾—äº† agent 在影象体现上的æå‡ï¼š
链接:https://www.reddit.com/r/LocalLLaMA/comments/1tf68yo/i_fitted_the_new_% CE% B4mem_research_for_apple_silicon/
δ-mem 会éšç€ Token 的输入,,,使用增é‡è§„则(delta-rule learning)一连更新一个牢é 巨细的矩阵。。。。。。在天生时,,,系统会从该状æ€ä¸è¯»å®ˆä¿¡å·ï¼Œï¼Œï¼Œå¯¹ä¸»å¹²ç½‘络的 Attention Query å’Œ Output æ–½åŠ ä½Žç§©æ ¡æ£ï¼ˆlow-rank corrections)。。。。。。
X ç½‘å‹ Dan 赞å¹é“:这就是 continual learning 的未æ¥ï¼
链接:https://x.com/daniel_mac8/status/2055740325822333419?s=20
LoRA Infra:百万级 LLM çš„è®ç»ƒä¸ŽæœåŠ¡åŸºå»º (MinT)
基于模å一连å¦ä¹ æ‰€æ‰“é€ çš„ agent 产å“éœ€è¦æ–°çš„基础设施,,,Mind Lab 给出了他们的谜底 MinT。。。。。。
什么是 MinT,,, 我们å¯ä»¥å…ˆçœ‹ X ç½‘å‹ Awais 的解读。。。。。。
泉æºï¼šhttps://x.com/drawais_ai/status/2056301110906757464?s=20
简朴æ¥è®²ï¼šMinT 是一个专为 LoRA è®ç»ƒå’Œåœ¨çº¿æœåŠ¡æ‰“é€ çš„æ‰˜ç®¡åŸºç¡€è®¾æ–½ç³»ç»Ÿã€‚ã€‚ã€‚ã€‚ã€‚ã€‚
在 δ-mem ä¸æåˆ°ï¼Œï¼Œï¼Œå·®åˆ«çš„äººã€å·®åˆ«çš„æ–¹å¼ä½¿ç”¨ agent,,,将会形æˆå·®åˆ«çš„影象状æ€ï¼Œï¼Œï¼ŒLoRA 也åŒç†ï¼Œï¼Œï¼Œæ²»ç† LoRA å¹¶éžæ²»ç†å•个模å,,,是治ç†ä¸€å¤§ç¾¤æ¨¡åçš„å˜ä½“。。。。。。
æ¯ä¸ª LoRA 都有自己的版本ã€è‡ªå·±çš„è®ç»ƒæ›²çº¿ã€è‡ªå·±çš„å›žæ»šç‚¹ã€æ›´ä¸»è¦çš„æ˜¯è¿™ä¸ª LoRA å¯èƒ½æ£åœ¨è¢«æŸä¸ªç”¨æˆ·ä½¿ç”¨ç€ã€‚ã€‚ã€‚ã€‚ã€‚ã€‚æ”¯æŒæ¨¡ååŽè®ç»ƒåœ¨çœŸå®žåœºæ™¯ä¸ä¸€è¿žå¦ä¹ 这件事è¦å»ºè®¾ï¼Œï¼Œï¼Œå¿…需有一套基础设施能够治ç†è¿™ä¹ˆå¤šæ°”概å„异的 LoRA。。。。。。
MinT æŠŠåŸºç¡€æ¨¡åæ’ä¹…ä¿ä¿å˜è®ç»ƒå’ŒæŽ¨ç†æœåŠ¡ä¸ã€‚。。。。。一æ¥è®ç»ƒç«£äº‹åŽï¼Œï¼Œï¼Œç³»ç»Ÿå¯¼å‡ºçš„䏿˜¯å®Œæ•´æ¨¡å,,,而是一份很å°çš„ LoRA Adapter。。。。。。评估ã€ä¸Šçº¿å’Œå›žæ»šæ—¶ï¼Œï¼Œï¼ŒMinT 也åªç§»åŠ¨å’ŒåŠ è½½è¿™ä»½ adapter。。。。。。
è¿™æ ·ï¼Œï¼Œï¼Œä¸Šçº¿ä¸€ä¸ªæ–°æˆ˜ç•¥ä¸éœ€è¦æŠŠ LoRA åˆå¹¶è¿›å®Œæ•´æ¨¡å,,,也ä¸éœ€è¦é‡æ–°åŠ è½½ä¸€ä»½å®Œæ•´æ¨¡åã€‚ã€‚ã€‚ã€‚ã€‚ã€‚ç³»ç»ŸåªæŠŠæ–°çš„ adapter 接到已ç»å¸¸é©»çš„基础模å上。。。。。。Adapter 的文件巨细通常ä¸åˆ°åŸºç¡€æ¨¡åçš„ 1%(在 rank-1 设置下å¯é™åˆ°çº¦ 0.1%)。。。。。。在现实丈é‡ä¸ï¼Œï¼Œï¼Œä»Žè®ç»ƒå®Œæˆåˆ°æŽ¨ç†æœåŠ¡å¯ç”¨çš„交接时间,,,最多å¯ç¼©çŸ 18.3 å€ã€‚。。。。。
MinT å°†é•¿æœŸåŒ–çš„æˆ˜ç•¥ç›®å½•ï¼ˆæˆ–è€…è¯´æµ·é‡ LoRA 集)与 CPU/GPU çš„çƒäº‹æƒ…é›†ç–æ•£ï¼Œï¼Œï¼Œæ”¯æŒ 以上级别的战略寻å€ã€‚。。。。。针对冷å¯åŠ¨åŠ è½½çš„ç“¶é¢ˆï¼Œï¼Œï¼ŒMinT 通过打包 MoE LoRA å¼ é‡ï¼Œï¼Œï¼ŒåŽ»é™¤äº†å¤§å®—å°å·¥å…·çš„è¯»å†™é£Žæš´ï¼Œï¼Œï¼Œä½¿å¼•æ“Žçš„å®žæ—¶åŠ è½½é€ŸçŽ‡æå‡äº† 8.5 至 8.7 å€ã€‚。。。。。
Packing è§£å†³çš„æ˜¯å•æ¬¡å†·åŠ è½½é—®é¢˜ï¼›ï¼›ï¼›ï¼›ä¸ºæ¶ˆé™¤æ–°å¢ž LoRA çš„å†·åŠ è½½å¯¹åœ¨çº¿æµé‡çš„æ»‹æ‰°ï¼Œï¼Œï¼ŒMinT 进一æ¥å¼•入二阶段 rollout:先在 admission 控制下完æˆé¢„çƒï¼Œï¼Œï¼Œä½¿ LoRA 仅在åœå½“åŽæ‰å¯¹ç”¨æˆ·æµé‡å¯è§ã€‚。。。。。在混淆负载测试下,,,该机制将用户å¯è§çš„ LoRA åŠ è½½ p95 é™è‡³ 0ã€é¦–请求 TTFT p95 ç¼©çŸ 2.3 å€ã€‚。。。。。
LoRA 的三大扩展轴:On the Scaling of PEFT
泉æºï¼šhttps://x.com/HuggingPapers/status/2056021071862575448?s=20
Mind Lab 还宣布了关于 LoRA çš„ç ”ç©¶è®ºæ–‡ On the Scaling of PEFT,,,针关于 base model 能够 serve 百万个 LoRA 模åçš„å¯è¡Œæ€§æå‡ºäº†ä¸‰å¤§åŸºäºŽ LoRA 的扩展轴:
第一个扩展轴:Scale up
强盛的基础模å能让细å°çš„æ›´æ–°çˆ†å‘é‡å¤§çš„æ æ†æ•ˆåº”ã€‚ã€‚ã€‚ã€‚ã€‚ã€‚ç›´è§‰ä¸Šæ›´å¤§å‚æ•°èƒ½å¤Ÿè®©æ¨¡å拥有更强的能力,,,在基础上è®ç»ƒçš„ LoRA 也会有更强的体现。。。。。。
1T 规模的希罕 MoE 上举行 LoRA 强化å¦ä¹ å¹¶éžå®¹æ˜“之事,,,由于 MoE 在è®ç»ƒå’ŒæŽ¨ç†åŽ†ç¨‹ä¸ä¸“家的激生路径差别会爆å‘严é‡çš„è®æŽ¨çº·æ§è‡´çš„å¾è±¡ã€‚。。。。。在 scale up 的历程ä¸ï¼Œï¼Œï¼ŒMind Lab 呿˜Žäº†çŽ°æœ‰è·¯ç”±é‡æ”¾ï¼ˆRouter Replayï¼‰æœºåˆ¶åœ¨å‰æ²¿ MoE 模åä¸Šå¤±æ•ˆåŽŸå› å¹¶æå‡ºå“应修æ£ä»¥æ¶ˆé™¤è®ç»ƒå’ŒæŽ¨ç†çš„差别。。。。。。
第二个扩展轴:Scale down
LoRA rank 决议 RL 适é…的表达能力强弱。。。。。。业界通常把 rank 设在 16–32,,,以求更稳的è®ç»ƒå’ŒæŽ¨ç†ã€‚。。。。。但è¦åŒæ—¶æœåŠ¡ä¸Šç™¾ä¸‡æ¨¡å,,,rank 还得继ç»åŽ‹åˆ° 16 以下,,,并且性能ä¸å¯æŽ‰ã€‚。。。。。
得益于 MinT adapter 的架构,,,Mind Lab 通过了一ç§åŽŸç”ŸäºŽ RL çš„åˆå§‹åŒ–è¦é¢†OLoRA-tail。。。。。。将 LoRA scale down 到了æžè‡´ã€‚。。。。。该è¦é¢†ä½¿ç”¨é¢„è®ç»ƒæƒé‡çš„æ¬¡è¦å¥‡å¼‚å‘é‡ï¼ˆminor singular vectors)举行åˆå§‹åŒ–,,,并移除了å¯èƒ½å¯¼è‡´å¼ºåŒ–å¦ä¹ ä¸ç¨³å›ºçš„å¥‡å¼‚å€¼ç¼©æ”¾å› å,,,在ä¸å¢žæ·»å‚数目的æ¡ä»¶ä¸‹ï¼Œï¼Œï¼Œå¤§å¹…æå‡äº† Rank-1 适é…器的稳固性与性能。。。。。。
第三个扩展轴:Scale out
MinT 让上百个 LoRA adapter åŒæ—¶åœ¨çº¿ï¼Œï¼Œï¼Œ"æ¨¡åæ•°ç›®" æˆäº†å¯æŽ§çš„ scaling å˜é‡ã€‚。。。。。
模åçš„å¤šæ ·æ€§ä»Žä½•è€Œæ¥ï¼Ÿï¼Ÿï¼Ÿï¼Ÿä¸Ž δ-mem 一脉相承,,,Mind Lab æå‡ºäº† LoRA as Memory 的看法并è¯å®ž LoRA 容é‡çº¦ tokens/paramï¼Œï¼Œï¼Œæ˜¯ä¸€ç§æœ‰é™ä»‹è´¨ï¼Œï¼Œï¼Œåº”留给 skillã€persona ç‰é•¿æœŸè¡Œä¸ºçжæ€è€Œéžå¯ç¼–è¾‘äº‹å®žï¼Œï¼Œï¼Œä»¥é¡ºåº”åº•åº§æ¨¡åæ¼«è¡å¤–的使命;;;;这ç§ä¸€è¿žå¦ä¹ ç”± Context Learning 完æˆï¼Œï¼Œï¼Œè®©å·®åˆ«çš„ adapter 沿差别路径分化。。。。。。
近期美团ã€é˜¿é‡Œçš„ç ”ç©¶ä¹ŸæŒ‡å‘统一åå‘,,,LoRA RL 内化的手艺能够为难题使命涤讪认知基础,,,体现显著优于 skill 或 context,,,且 LoRA èƒ½ä»¥å°‘å°‘å‚æ•°é«˜æ•ˆè£…下结构化事实,,,形æˆå·®åˆ«åŒ–的稳固模å。。。。。。
è¿™ç§å·®åˆ«åœ¨èšé€‚时被兑现,,, å¤§éƒ½æŠ•ç¥¨ä¸‹å‡†ç¡®çŽ‡éšæ¨¡åæ•°ç›® k 泛起出履历上的对数增添定律()。。。。。。这也是在三个扩展轴上涌现出æ¥çš„ã€åŸºäºŽæ¨¡å数目的 scaling law。。。。。。
Macaron-A2UI:走å‘å¤©ç”Ÿå¼ UI 的智能交互
ä¸ä½†æ˜¯ç†è®ºï¼Œï¼Œï¼ŒMind Lab 也试验性地宣布了一个基于 MinT è®ç»ƒå‡ºæ¥çš„æ¨¡åMacaron-A2UI
他们自己的形貌是:纯文本对è¯åœ¨å¤„ç†é‡å¤§çš„用户使命时ä¿å˜è®¤çŸ¥è´Ÿè·é«˜ã€æµç¨‹ç¹ç的瓶颈。。。。。。为æ¤ï¼Œï¼Œï¼ŒMind Lab 基于 MinT è®ç»ƒäº†å‡è¯ç”¨æˆ·ä¸“å±žä¹ æƒ¯ä¸€è¿žå¦ä¹ çš„å¤©ç”Ÿå¼ UI 模å Macaron-A2UI。。。。。。
模åä¸ä½†ä»…输出文本,,,还能在实时交互ä¸å¤©ç”Ÿç»“构化的 A2UI 坿‰§è¡Œè¡ŒåŠ¨ï¼ˆå¦‚å¤šé€‰æ¡†ã€æ»‘å—ã€ç¡®è®¤å¡ç‰‡ç‰ï¼‰ã€‚。。。。。
Macaron-A2UI çš„è®ç»ƒåŽ†ç¨‹ä¹Ÿæ˜¯è¯ é‡Šäº† Mind Lab 上é¢çš„一系列ç†è®ºï¼šåœ¨ 30B,,,235B å’Œ 754B 的大è¯è¨€æ¨¡å底座上,,,基于 MinT å¹³å°ï¼Œï¼Œï¼Œå›¢é˜Ÿå…ˆä½¿ç”¨åŸºäºŽ LoRA çš„ SFT(监视微调)建设文本到 UI 的对é½ï¼Œï¼Œï¼ŒéšåŽä½¿ç”¨ GRPO 强化å¦ä¹ æå‡å¯æ‰§è¡Œäº¤äº’的质é‡ã€‚。。。。。
在æžå…¶è½»é‡çº§çš„ Schema æé†’下,,,体现最好的 Macaron-A2UI-Venti 模å在 A2UI-Bench 上斩获了 75.6 的综åˆé«˜åˆ†ï¼Œï¼Œï¼Œç”šè‡³é€¾è¶Šäº†è¾“入了完整冗长 Schema(长度约为 27 å€ï¼‰ æé†’çš„æœ€å¼ºå‰æ²¿æ¨¡å基线。。。。。。这è¯å®žæ™°é‡å¤§çš„ UI 天生能力完全å¯ä»¥é€šè¿‡é«˜æ•ˆå¾®è°ƒè¢«å†…åŒ–åˆ°æ¨¡åæƒé‡ä¸ã€‚。。。。。
从现在通用模å的痛点出å‘,,,Mind Lab æ‰“é€ äº†èƒ½å¤Ÿåœ¨çº¿ä¸€è¿žå¦ä¹ çš„ δ-memã€é¢å‘百万 LoRA 模åçš„è®æŽ¨åŸºç¡€è®¾æ–½ MinT ä»¥åŠ LoRA Scaling Law ç†è®ºã€‚。。。。。从最新宣布的 A2UI 模åï¼Œï¼Œï¼Œåˆ°ä¸€ç›´åšæŒçš„一连å¦ä¹ ç ”ç©¶åå‘,,,Mind Lab 冿¬¡å±•示了从应用ã€ç³»ç»Ÿåˆ°ç†è®ºçš„ç ”ç©¶çºµæ·±ã€‚ã€‚ã€‚ã€‚ã€‚ã€‚
æ®æ‚‰ï¼Œï¼Œï¼ŒMind Lab çš„æ‰€å±žå…¬å¸æ˜¯ Mindverse(心洲科技)。。。。。。这家ä¸å›½åŽŸç”Ÿçš„ Neo Lab 跑通了一æ¡ä½Žæœ¬é’±é«˜æ”¶ç›Šçš„一连å¦ä¹ 之路,,,æ£å¦‚其论文所æç»˜çš„é‚£æ ·ï¼Œï¼Œï¼Œæœªæ¥çš„ AI æž¶æž„æˆ–è®¸æ£æ˜¯äº‘äº‘ï¼šå°‘æ•°å‡ ä¸ªå¼ºç››çš„ä¸‡äº¿å‚æ•°åŸºç¡€æ¨¡å,,,支æŒèµ·æ•°ç™¾ä¸‡ä¸ªå‚æ•°ç›®æžå°ä½†å…·æœ‰è‡ªåŠ›ä¸ªæ€§ã€å½±è±¡å’Œ UI 交互能力的å¯ä¸€è¿žå¦ä¹ 智能体。。。。。。
@å¶é˜³ç :ky8018开元,,,ä¸ç¾Žå…ƒé¦–会晤释放了哪些主è¦ä¿¡å·@陈信æ„:女å在åšç‰©é¦†çœ‹åˆ°â€œé—ºèœœâ€äº†
@æŽå§¿å©·ï¼šè€èµ–获130万å´ä¸è¿˜27ä¸‡æ¬ æ¬¾ 获刑åŠå¹´
çƒé—¨æŽ’行
- 1 威尼斯最新的域名
- 2 江南官方体育app尤文图斯
- 3 荣胜国际真人游戏
- 4 大地网投登录平台
- 5 kauyun体育
- 6 网赌十大
- 7 大发657官方
- 8 澳门网上第一娱乐
- 9 10博bet官方