国产大模子公司MiniMax6月1日正式宣布新一代通用模子MiniMax M3。。。。据先容,,,,,,M3接纳全新的自研希罕注重力架构MiniMax Sparse Attention(MSA),,,,,,在编程及智能体能力、超长上下文及原生多模态等多个要害偏向,,,,,,均实现代际突破。。。。
MiniMax披露,,,,,,在100万上下文规模下,,,,,,M3单词元(Token)盘算量仅为上一代模子的约二十分之一,,,,,,推理效率显著提升。。。。
从底层注重力机制重构百万词元上下文
MiniMax M3是具备“前沿 Coding 能力”“1M超长上下文”“原生多模态”三项焦点能力的大模子,,,,,,而支持MiniMax M3三大能力合一的,,,,,,是其自研的希罕注重力架构MSA(MiniMax Sparse Attention)。。。。
相较古板全注重力机制,,,,,,MSA能显著降低长上下文下的盘算本钱,,,,,,并将上下文窗口提升至100万词元,,,,,,这意味着模子在处理长文档、重大代码客栈、多轮使命协作等场景时,,,,,,能够在一次推理中保存更完整的信息链路。。。。MiniMax披露,,,,,,在100万上下文规模下,,,,,,M3单词元盘算量仅为上一代模子的约二十分之一,,,,,,推理效率显著提升。。。。
除模子架构升级外,,,,,,MiniMax在底层推理算子层面也开展了进一步优化。。。。据披露,,,,,,通过重新设计数据读取与盘算路径,,,,,,相关性能较主流开源方案提升4倍以上。。。。
业内人士以为,,,,,,全球大模子竞赛正在突出新的变量。。。。随着智能体(Agent)使命重漂后一直提高,,,,,,“更长上下文”“更稳固影象”“更低本钱推理”正成为决议产品可用性的要害能力。。。。
AI进入现实执行层的速率加速
MiniMax M3在编程和智能体训练中引入了交互式用户模拟器框架,,,,,,通过模拟真实开发者在协作历程中的行为模式,,,,,,让模子在训练和评测阶段就接触到更靠近生产情形的交互场景。。。。
业内人士以为,,,,,,从代码开发、研究剖析到跨应用协同执行,,,,,,编程和自主署理能力正逐步成为全球头部模子的新竞争焦点。。。。此次MiniMax重点强化这一能力,,,,,,也被视为对下一阶段AI产品形态的提前结构。。。。
原生多模态也是MiniMax M3的显著特点之一。。。。MiniMax相关认真人体现,,,,,,MiniMax M3从训练起点便接纳文本、图片、视频等多模态混淆训练,,,,,,并在数据规模和训练管线上进一步扩展。。。。模子不但支持图像与视频明确,,,,,,也具备桌面操作能力,,,,,,可在重大跨应用情形中执行盘算机操作使命。。。。
总体上看,,,,,,大模子能力正在从语言明确进一步向真实数字情形延伸。。。。无论是办公自动化、企业软件操作照旧更重大的生产力场景,,,,,,AI进入现实执行层的速率正在显着加速。。。。
MiniMax启动A股IPO
MiniMax克日已启动A股IPO历程。。。。据证监会网站新闻,,,,,,MiniMax已于2026年5月29日同中信证券签署向导协议。。。。
5月31日,,,,,,MiniMax在港交所通告,,,,,,董事会宣布已决议探讨拟刊行人民币股份的起源建议。。。。公司在香港联交所乐成上市后,,,,,,公司一连评估资源市场,,,,,,包括对在科创板上市举行评估。。。。阻止本通告日期,,,,,,公司已约请专业照料就公司切合在科创板上市的条件提供咨询,,,,,,并已签署向导协议。。。。
通告称,,,,,,拟刊行人民币股份事宜将取决于市场状态及须要的羁系批准。。。。公司股东及潜在投资者生意公司股票时请审慎行事。。。。
MiniMax今年1月上岸港交所。。。。在港股上市首日,,,,,,MiniMax股价就大涨翻倍,,,,,,随后更是接连大涨,,,,,,最高至1330港元/股。。。。
徐泓曾动情地回忆起一段往事:早年带着脱离福建老家多年的父亲赴美,,,,,,在东京转机时,,,,,,父亲看到中国民航的飞机,,,,,,就地泪流满面。。。。