MiniMax宣布新模子M3 AI大模子竞争转向长上下文与智能体能力
国产大模子公司MiniMax6月1日正式宣布新一代通用模子MiniMax M3。。。。。据先容,,,,M3接纳全新的自研希罕注重力架构MiniMax Sparse Attention(MSA),,,,在编程及智能体能力、超长上下文及原生多模态等多个要害偏向,,,,均实现代际突破。。。。。
MiniMax披露,,,,在100万上下文规模下,,,,M3单词元(Token)盘算量仅为上一代模子的约二十分之一,,,,推理效率显著提升。。。。。
从底层注重力机制重构百万词元上下文
MiniMax M3是具备“前沿 Coding 能力”“1M超长上下文”“原生多模态”三项焦点能力的大模子,,,,而支持MiniMax M3三大能力合一的,,,,是其自研的希罕注重力架构MSA(MiniMax Sparse Attention)。。。。。
相较古板全注重力机制,,,,MSA能显著降低长上下文下的盘算本钱,,,,并将上下文窗口提升至100万词元,,,,这意味着模子在处理长文档、重大代码客栈、多轮使命协作等场景时,,,,能够在一次推理中保存更完整的信息链路。。。。。MiniMax披露,,,,在100万上下文规模下,,,,M3单词元盘算量仅为上一代模子的约二十分之一,,,,推理效率显著提升。。。。。
除模子架构升级外,,,,MiniMax在底层推理算子层面也开展了进一步优化。。。。。据披露,,,,通过重新设计数据读取与盘算路径,,,,相关性能较主流开源方案提升4倍以上。。。。。
业内人士以为,,,,全球大模子竞赛正在突出新的变量。。。。。随着智能体(Agent)使命重漂后一直提高,,,,“更长上下文”“更稳固影象”“更低本钱推理”正成为决议产品可用性的要害能力。。。。。
AI进入现实执行层的速率加速
MiniMax M3在编程和智能体训练中引入了交互式用户模拟器框架,,,,通过模拟真实开发者在协作历程中的行为模式,,,,让模子在训练和评测阶段就接触到更靠近生产情形的交互场景。。。。。
业内人士以为,,,,从代码开发、研究剖析到跨应用协同执行,,,,编程和自主署理能力正逐步成为全球头部模子的新竞争焦点。。。。。此次MiniMax重点强化这一能力,,,,也被视为对下一阶段AI产品形态的提前结构。。。。。
原生多模态也是MiniMax M3的显著特点之一。。。。。MiniMax相关认真人体现,,,,MiniMax M3从训练起点便接纳文本、图片、视频等多模态混淆训练,,,,并在数据规模和训练管线上进一步扩展。。。。。模子不但支持图像与视频明确,,,,也具备桌面操作能力,,,,可在重大跨应用情形中执行盘算机操作使命。。。。。
总体上看,,,,大模子能力正在从语言明确进一步向真实数字情形延伸。。。。。无论是办公自动化、企业软件操作照旧更重大的生产力场景,,,,AI进入现实执行层的速率正在显着加速。。。。。
MiniMax启动A股IPO
MiniMax克日已启动A股IPO历程。。。。。据证监会网站新闻,,,,MiniMax已于2026年5月29日同中信证券签署向导协议。。。。。
5月31日,,,,MiniMax在港交所通告,,,,董事会宣布已决议探讨拟刊行人民币股份的起源建议。。。。。公司在香港联交所乐成上市后,,,,公司一连评估资源市。。。。。,,包括对在科创板上市举行评估。。。。。阻止本通告日期,,,,公司已约请专业照料就公司切合在科创板上市的条件提供咨询,,,,并已签署向导协议。。。。。
通告称,,,,拟刊行人民币股份事宜将取决于市场状态及须要的羁系批准。。。。。公司股东及潜在投资者生意公司股票时请审慎行事。。。。。
MiniMax今年1月上岸港交所。。。。。在港股上市首日,,,,MiniMax股价就大涨翻倍,,,,随后更是接连大涨,,,,最高至1330港元/股。。。。。
文章点评
未盘问到任何数据!
揭晓谈论
◎接待加入讨论,,,,请在这里揭晓您的看法、交流您的看法。。。。。