凯时AG

2026-07-03 15:51:13 设为首页 | 加入珍藏

业界首个!美团宣布LongCat-2.0:总参数规模1.6万亿 全程由国产算力训练

2026-07-03 15:51:13 宣布 泉源:腾讯软件中心 作者:王欣洁 浏览:5095次

快科技6月30日新闻,,,,,今日,,,,,美团宣布新一代万亿参数大模子LongCat-2.0,,,,,并将对外开源 。。。。

据先容,,,,,LongCat-2.0是业界首个依赖国产算力完成训练、推理全流程的万亿参数大模子,,,,,总参数规模1.6万亿,,,,,从零最先预训练,,,,,原生支持1M超长上下文 。。。。

此前,,,,,该大模子的测试版本在OpenRouter上的总挪用量已跻身全球前三 。。。。

其中在Hermes的月挪用量位列全球第一,,,,,在Claude Code的月挪用量位列全球第二,,,,,仅次于Claude Opus 4.8 。。。。

LongCat官方宣布,,,,,将于近期开源Infra框架、推理引擎、模子参数等焦点手艺,,,,,以回馈全球开发者社区 。。。。

据悉,,,,,LongCat-2.0预训练数据规模凌驾30T tokens,,,,,笼罩中文、英文、多语言和代码等多类数据 。。。。

面临万卡级训练中的硬件故障、通讯异常、显存压力与数值波动,,,,,LongCat团队从稳固性、准确性和效率三方面攻克国产算力训练难题 。。。。

在稳固性上,,,,,通过HCCL异常处理、弹性扩缩卡和自动故障恢复,,,,,将月均日故障率降低70%以上 。。。。

在准确性上,,,,,通过自研设计确定性算子、Bitwise一致性验证和参数检测,,,,,包管训练效果的可靠,,,,,同时基于实践提升要害 ???榕趟憔取⒂呕疪educe逻辑 。。。。

在效率上,,,,,通过流水线调理、显存优化和算子级控核,,,,,训练MFU提升1.5倍 。。。。

最终,,,,,LongCat实现稳态日吞吐凌驾1T tokens/day,,,,,完成万亿参数MoE模子在国产算力上的稳固训练 。。。。

云雾低垂映山城 重庆夜景宛若“天空之镜”

责任编辑:郭玮茂    校对:陈怡珠

今日热门

  1. 传习录丨“孩子们生长得更好,,,,,是我们最大的心愿”
  2. 光大期货:6月25日软商品日报
  3. 中华人民共和国和蒙古外洋交部长谈判联合新闻公报
  4. 民盟十三届十五次中;;;嵩谒拇ㄋ炷举行 丁仲礼王光谦出席
  5. 印度华人称晒2分钟太阳感受要中暑
  6. 中外艺术家走进新疆唐布拉草原写生
  7. 这届老外太会玩了 体验中国首个无目的地海上游
  8. 以色列称内塔尼亚胡秘访阿联酋 阿方否认
  9. 此行间·“天下向东看”!100秒看大外洋交的忙碌五月
  10. 安徽深山“仙草”闯天下:从林下到外洋货架

相关推荐

【网站地图】