凯时AG

2026-06-16 12:36:59 设为首页 | 加入珍藏

小米大模子上线新模式 推理速率突破1000 tokens/s

2026-06-16 12:36:59 宣布 泉源:漫画大全 作者:蔡丽娟 浏览:5402次

新京报贝壳财经讯(记者陈维城)6月8日晚,,, ,,,小米MiMo手艺团队正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式,,, ,,,在通用GPU上推理速率突破1000 tokens/s。。。。。

MiMo-V2.5-Pro-UltraSpeed通过对模子推理系统的全链路工程能力优化,,, ,,,在不降低模子能力条件下,,, ,,,首次把推理速率提升至1000 tokens/s,,, ,,,且无需定制芯片、只使用通用GPU即可告竣。。。。。这一突破突破了“快、强、通用 GPU无法兼得”的行业不可能三角。。。。。

小米MiMo手艺团队体现,,, ,,,该突破是基于Xiaomi MiMo-V2.5 Pro的SWA架构,,, ,,,叠加了FP4 Experts、DFlash解码以及TileRT团队的执行系统Co?design,,, ,,,从模子到推理引擎再到GPU执行路径举行了全链路优化。。。。。

克日起至6月23日,,, ,,,MiMo-V2-Pro-UltraSpeed模式将接纳申请制限时开放,,, ,,,通过申请的用户可接入API 举行体验。。。。。

自4月尾以来,,, ,,,小米AI在模子能力、推理本钱和推理效率三个维度接连取得突破:4月23日,,, ,,, MiMo-V2.5-Pro在全球权威大模子测评平台Artificial Analysis上,,, ,,,获得综合智能指数与Agent指数全球开源模子并列第一;;;;5月27日,,, ,,,Xiaomi MiMo-V2.5系列模子API因手艺优化宣布最高降价99%,,, ,,,并同程序整Token Plan计费系统。。。。。6月8日,,, ,,,MiMo-V2.5-Pro-UltraSpeed以1000 tokens/s创下万亿参数旗舰模子推理速率新纪录。。。。。

编辑 杨娟娟

校对 王心

新华社东京5月20日电(记者梁晨 陈泽安)据日本气象厅新闻,,, ,,,日本冲绳县周围海域20日爆发5.9级地动。。。。。

责任编辑:杨志宏    校对:杨恭美

今日热门

  1. 伊拉克“国脚”入境美国遭近7小时盘问
  2. 辽宁无障碍情形建设督导队提升医疗机构无障碍服务水平
  3. 天下最泰半潜式综合性网箱养殖平台将投产
  4. 神舟二十一号航天员乘组创立中国航天员乘组在轨驻留最长纪录
  5. 张雪呼吁车友勿拉踩其他品牌
  6. 中新康健|七部分宣布《医药代表治理步伐》:严酷提防商业行贿行为
  7. 昔时轻人走进上市公司股东大会:有人买100股只为参会
  8. 多国留学生在河北秦皇岛陶醉式体验长城文化
  9. 经济日报谈论员:青春的底色永远是奋斗
  10. 伊朗总统与最高首脑举行碰面 一连约两个半小时

相关推荐

【网站地图】