凯时AG

2026-06-16 09:01:29 设为首页 | 加入珍藏

小米大模子上线新模式 推理速率突破1000 tokens/s

2026-06-16 09:01:29 宣布 泉源:i苹果助手 作者:张介玟 浏览:4587次

新京报贝壳财经讯(记者陈维城)6月8日晚,,,小米MiMo手艺团队正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式,,,在通用GPU上推理速率突破1000 tokens/s。。。。

MiMo-V2.5-Pro-UltraSpeed通过对模子推理系统的全链路工程能力优化,,,在不降低模子能力条件下,,,首次把推理速率提升至1000 tokens/s,,,且无需定制芯片、只使用通用GPU即可告竣。。。。这一突破突破了“快、强、通用 GPU无法兼得”的行业不可能三角。。。。

小米MiMo手艺团队体现,,,该突破是基于Xiaomi MiMo-V2.5 Pro的SWA架构,,,叠加了FP4 Experts、DFlash解码以及TileRT团队的执行系统Co?design,,,从模子到推理引擎再到GPU执行路径举行了全链路优化。。。。

克日起至6月23日,,,MiMo-V2-Pro-UltraSpeed模式将接纳申请制限时开放,,,通过申请的用户可接入API 举行体验。。。。

自4月尾以来,,,小米AI在模子能力、推理本钱和推理效率三个维度接连取得突破:4月23日,,, MiMo-V2.5-Pro在全球权威大模子测评平台Artificial Analysis上,,,获得综合智能指数与Agent指数全球开源模子并列第一;;;;;5月27日,,,Xiaomi MiMo-V2.5系列模子API因手艺优化宣布最高降价99%,,,并同程序整Token Plan计费系统。。。。6月8日,,,MiMo-V2.5-Pro-UltraSpeed以1000 tokens/s创下万亿参数旗舰模子推理速率新纪录。。。。

编辑 杨娟娟

校对 王心

而转头再看高青与刘文峰,,,一个守着深圳车间里的无尘灯,,,一个盯着江西监测平台上的预警曲线;;;;;一个做的是电子装备里的“频率心脏”,,,一个守的是都会运行中的“生命清静”。。。。

责任编辑:陈上紫    校对:黄慧海

今日热门

  1. 广西推动家庭医生签约服务提质 增强下层康健包管能力
  2. 绿水青山间,,,万物有灵且美
  3. 中方回应“黄岩岛有不明结构物消逝”
  4. 杭州启动三大世遗联动妄想 推出“世遗之间”品牌
  5. 5月中国新能源汽车出口量同比增添1.1倍
  6. 十年票房暴涨近八倍 业界建言两岸携手做强中国音乐剧市场
  7. 雨中竞速 2026“庐山杯”长江经济带龙舟约请赛开赛
  8. 美国驻格陵兰岛领事馆新址开馆 遭外地民众抗议
  9. 开局“十五五” 奋楫新征程·聚焦新疆算力工业①丨 算力起势
  10. 悬崖上植树有多灾???揭秘“三北”工程硬核造林历程

相关推荐

【网站地图】