凯时AG

2026-07-06 07:01:07 设为首页 | 加入珍藏

业界首个!美团宣布LongCat-2.0:总参数规模1.6万亿 全程由国产算力训练

2026-07-06 07:01:07 宣布 泉源:维维下载 作者:丁勇羽 浏览:2502次

快科技6月30日新闻,,,,,,今日,,,,,,美团宣布新一代万亿参数大模子LongCat-2.0,,,,,,并将对外开源。。。。。。

据先容,,,,,,LongCat-2.0是业界首个依赖国产算力完成训练、推理全流程的万亿参数大模子,,,,,,总参数规模1.6万亿,,,,,,从零最先预训练,,,,,,原生支持1M超长上下文。。。。。。

此前,,,,,,该大模子的测试版本在OpenRouter上的总挪用量已跻身全球前三。。。。。。

其中在Hermes的月挪用量位列全球第一,,,,,,在Claude Code的月挪用量位列全球第二,,,,,,仅次于Claude Opus 4.8。。。。。。

LongCat官方宣布,,,,,,将于近期开源Infra框架、推理引擎、模子参数等焦点手艺,,,,,,以回馈全球开发者社区。。。。。。

据悉,,,,,,LongCat-2.0预训练数据规模凌驾30T tokens,,,,,,笼罩中文、英文、多语言和代码等多类数据。。。。。。

面临万卡级训练中的硬件故障、通讯异常、显存压力与数值波动,,,,,,LongCat团队从稳固性、准确性和效率三方面攻克国产算力训练难题。。。。。。

在稳固性上,,,,,,通过HCCL异常处理、弹性扩缩卡和自动故障恢复,,,,,,将月均日故障率降低70%以上。。。。。。

在准确性上,,,,,,通过自研设计确定性算子、Bitwise一致性验证和参数检测,,,,,,包管训练效果的可靠,,,,,,同时基于实践提升要害模??榕趟憔取⒂呕疪educe逻辑。。。。。。

在效率上,,,,,,通过流水线调理、显存优化和算子级控核,,,,,,训练MFU提升1.5倍。。。。。。

最终,,,,,,LongCat实现稳态日吞吐凌驾1T tokens/day,,,,,,完成万亿参数MoE模子在国产算力上的稳固训练。。。。。。

“求真求实”的创作态度成绩影片的乐成,,,,,,是与会专家的一致共识。。。。。。《给阿嬷的情书》坚持潮汕方言对白、大宗素人演员出演,,,,,,剧本直至剪辑阶段仍动态打磨,,,,,,拒绝套路化煽情。。。。。。中国影戏谈论学会副会长陆弘石指出,,,,,,影片以“新、特、优”突围:故事新颖、情绪奇异、叙事优质。。。。。。与此同时,,,,,,他以为,,,,,,该片的乐成有助于破除IP迷思和手艺迷思,,,,,,古板形态的影戏只要能够表达今众人的思索,,,,,,就是最具现代性的,,,,,,中国影戏美学建设上仍要自信。。。。。。

责任编辑:黄瑜坚    校对:朱景维

今日热门

  1. 海南自贸港开启首单A320飞机拆解营业
  2. 【文化中国行】薪火相传 秦腔不老
  3. 北京2026年高考收官 考生逐梦开启人生新篇
  4. 广东广州:广交会收支境外国人数目立异高
  5. 武契奇首次对华举行国是会见 专家:中塞关系迈入崭新阶段
  6. 从“无声默契”到桥下纳凉:青藏铁路与藏羚羊的20年
  7. 为文物立档 为历史存证(中国蹊径中国梦)
  8. 上亿组个人信息被明码标价 独家披露“开盒”黑产链条细节
  9. 原创芭蕾舞剧《归义》上岸广州大剧院
  10. 方寸勋章载深情

相关推荐

【网站地图】