凯时AG

2026-07-03 13:25:30 设为首页 | 加入珍藏

业界首个!美团宣布LongCat-2.0:总参数规模1.6万亿 全程由国产算力训练

2026-07-03 13:25:30 宣布 泉源:偶要下载 作者:林静乐 浏览:3344次

快科技6月30日新闻,, ,,今日,, ,,美团宣布新一代万亿参数大模子LongCat-2.0,, ,,并将对外开源。。。。

据先容,, ,,LongCat-2.0是业界首个依赖国产算力完成训练、推理全流程的万亿参数大模子,, ,,总参数规模1.6万亿,, ,,从零最先预训练,, ,,原生支持1M超长上下文。。。。

此前,, ,,该大模子的测试版本在OpenRouter上的总挪用量已跻身全球前三。。。。

其中在Hermes的月挪用量位列全球第一,, ,,在Claude Code的月挪用量位列全球第二,, ,,仅次于Claude Opus 4.8。。。。

LongCat官方宣布,, ,,将于近期开源Infra框架、推理引擎、模子参数等焦点手艺,, ,,以回馈全球开发者社区。。。。

据悉,, ,,LongCat-2.0预训练数据规模凌驾30T tokens,, ,,笼罩中文、英文、多语言和代码等多类数据。。。。

面临万卡级训练中的硬件故障、通讯异常、显存压力与数值波动,, ,,LongCat团队从稳固性、准确性和效率三方面攻克国产算力训练难题。。。。

在稳固性上,, ,,通过HCCL异常处理、弹性扩缩卡和自动故障恢复,, ,,将月均日故障率降低70%以上。。。。

在准确性上,, ,,通过自研设计确定性算子、Bitwise一致性验证和参数检测,, ,,包管训练效果的可靠,, ,,同时基于实践提升要害?????榕趟憔取⒂呕疪educe逻辑。。。。

在效率上,, ,,通过流水线调理、显存优化和算子级控核,, ,,训练MFU提升1.5倍。。。。

最终,, ,,LongCat实现稳态日吞吐凌驾1T tokens/day,, ,,完成万亿参数MoE模子在国产算力上的稳固训练。。。。

现在“空中信使”来了。。。。无人机沿着预设航线穿越峡谷,, ,,不受塌方断道影响,, ,,准时将报刊、录取通知书、包裹等送达。。。。

责任编辑:蔡嘉莲    校对:许家慧

今日热门

  1. 当抗癌妈妈撕掉“100个遗愿清单”
  2. 广西柳州爆发5.2级地动 柳州启动地动Ⅲ级应急响应
  3. 联合国秘书长:对中东时势升级深表担心
  4. 人形机械人研学游亮相 北京石景山文旅融合“上新”
  5. 香港上演端午龙舟竞渡
  6. 大美边疆看我家丨我的家乡在赛尔山脚下
  7. 赖清德搭乘斯威士兰国王“私人飞机”窜斯 外交部回应
  8. 私域直播设陷阱“拼单赌石”藏圈套老人花百万买原石 然而蹊跷一幕爆发
  9. 电工岗位被AI热潮带火,, ,,“老行当”怎样讲好就业“新故事”?????
  10. 国际影戏制片人协会副主席:“中国唯一国际A类影戏节”具有生长性

相关推荐

【网站地图】