凯时AG

2026-06-15 06:51:14 设为首页 | 加入珍藏

果真版Mythos上线,,,,Claude最强模子最先分层发售

2026-06-15 06:51:14 宣布 泉源:参考新闻 作者:郭淑卿 浏览:8292次

Anthropic终于把Mythos推向了果真市场,,,,但分层发售。。。

破晓,,,,Anthropic正式宣布Claude Fable 5和Claude Mythos 5。。。前者面向通俗用户开放,,,,后者则继续限制在“受信任的清静相助同伴”规模内。。。

新模子的命名可以说很切合Claude一直的气概。。。

从Haiku(俳句)到Sonnet(十四行诗)再到Opus(艺术巨著),,,,Anthropic一直在用文学和艺术看法给模子分层,,,,到了Mythos,,,,名字已经从文学作品膨胀到“神话”自己。。。

Fable来自拉丁语fabula,,,,意思是“被讲述之物”,,,,和希腊语mythos同源,,,,直译过来的话一般被称为“寓言”。。。这个名字正如新模子的定位,,,,一个“Mythos级”的模子,,,,一个“果真的神话”。。。

凭证Anthropic的形貌,,,,Fable 5和Mythos 5共享统一个底层模子,,,,只是被装进了更适合果真分发的清静壳里。。。在官方给出的模子能力上,,,,它们两个被放在统一个位置。。。

但跑分归跑分,,,,若是Fable和Mythos的体现完全一样,,,,我想应该也不必分成两个名字了。。。

被改写的“神话”

神话被改写、被压缩、被加上训诫之后,,,,酿成了寓言。。。

凭证官方文档,,,,Fable 5是果真版本。。。它面向通俗用户和开发者开放,,,,但在网络清静、生物、化学以及模子蒸馏等高风险领域,,,,会由特另外清静分类器介入。。。一旦系统判断请求可能涉及这些敏感偏向,,,,回覆就不会由Fable 5继续完成,,,,而是自动回退到Claude Opus 4.8。。。

Mythos 5基于同样的底层模子,,,,但在部分领域扫除了Fable 5的护栏。。。Anthropic称,,,,Project Glasswing里的网络清静相助同伴可以使用“满血版”Mythos 5;;;;未来,,,,部学生命科学研究者也可能通过受信任会见妄想,,,,使用扫除生物和化学限制的版本。。。

用不到的Mythos我们暂时不提,,,,先看点着实的工具。。。

首先是定价,,,,一个字,,,,贵。。。

Fable 5的定价是输入10美元/百万token,,,,输出50美元/百万token。。? ??⒄呦衷诰涂梢酝ü鼵laude API挪用claude-fable-5(模子名)。。。

这个价钱恰恰是Opus 4.8的两倍,,,,和Opus 4.8的fast mode相同,,,,Anthropic显然把它放在了比Opus更高一档的价钱层级里。。。

不过Anthropic称,,,,这一价钱不到此前Claude Mythos Preview的一半——但由于Mythos Preview并非果真API模子,,,,官方并未给出面向公众的标准价,,,,这句话也无从验证。。。

订阅用户也需要注重,,,,Fable 5纷歧定会恒久直接包括在基础订阅包里。。。

Anthropic在官方说明中提到,,,,6月23日以后,,,,纵然用户已经订阅Claude,,,,Fable 5也可能凭证算力情形按量提供,,,,纷歧定会直接包括在基础订阅服务中。。。

这公司越来越小气了,,,,不过好歹还留了小半个月试用期。。。官方也留了一点余地:若是6月23日以后算力资源足够,,,,Anthropic会只管把Fable 5继续包括在Pro、Max等订阅服务里。。。

定价高自己并训斥以明确,,,,但它最好包管它的能力配得上它的价钱。。。

从跑分上看,,,,Fable 5/Mythos 5基本是Anthropic现在果真内外最强的一档。。。

不过官方表格有一个说明,,,,Claude Fable 5和Claude Mythos 5的分数一般只差1–3个百分点(除了带星号的网络清静、生物相关测试),,,,以是内外显示的是两者更高的分数。。。这一点很难不让人想要吐槽。。。

Anthropic把Fable 5的重点放在几个偏向:软件工程、知识事情、视觉、长上下文影象和生命科学研究。。。

软件工程是最突出的场景之一,,,,凭证表格,,,,Fable/Mythos 5在SWE-Bench Pro上抵达80.3%,,,,显着高于Opus 4.8的69.2%;;;;在更难的FrontierCode Diamond上,,,,它拿到29.3%,,,,而Opus 4.8只有13.4%,,,,GPT-5.5只有5.7%。。。

知识事情和视觉使命上,,,,Anthropic给出了两类证据。。。

一类是标准化benchmark。。。官方表格显示,,,,Fable/Mythos 5在GDPval-AA上得分1932,,,,高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro;;;;在GDP.pdf这种带视觉明确的文档使命上,,,,它抵达29.8%,,,,也凌驾其他主要模子。。。

另一类是早期客户测试。。。Anthropic称,,,,Fable 5在Hebbia的高级金融推理基准上取得最高分,,,,优势集中在文档推理、图表和表格明确、问题求解;;;;IMC也反馈,,,,它在生意剖析评估中险些周全通过。。。

为了展示Fable 5的视觉能力,,,,Anthropic举的例子是:此前Claude模子需要重大辅助工具才华玩《宝可梦 火红》,,,,而Fable 5只靠视觉输入就可以通关。。。

长使命和影象能力上,,,,Anthropic称,,,,Fable 5可以在数百万token的恒久使命中坚持专注,,,,并使用自己的条记刷新输出。。。

在《杀戮尖塔》这类需要一连决媾和恒久战略的游戏里,,,,若是给Fable 5接入长期文件影象,,,,让它能纪录前面的选择和履历,,,,它的体现会显着提升。。。提升幅度是Opus 4.8的三倍,,,,抵达最终关卡的次数也提高了三倍。。。

顺便一提,,,,Fable也是一款经典RPG游戏的名字,,,,中文译作《神鬼寓言》——或许某天我们能看到Fable玩《Fable》。。。

另外,,,,网络清静能力方面,,,,Fable/Mythos 5在ExploitBench Cap%上抵达78.0%,,,,凌驾Claude Mythos Preview的69.0%,,,,靠近Opus 4.8的两倍。。。

这里用的应该是Mythos 5的得分,,,,由于Fable 5在高风险请求上会回退到Opus 4.8。。。

强盛的模子必需分层

Anthropic这次把模子能力的直观展示放到了一个类似”作品集“的滑页里,,,,并且每个demo只给了一小段注释。。。

好比,,,,Fable 5写了一个太阳系模拟,,,,从物理第一性原理推导行星轨道运动,,,,并用它展望日食。。。

又好比,,,,它可以自主玩《异星工厂》。。。这是一款工程师很爱的工厂自动化游戏,,,,玩家要收罗资源、妄想生产线、搭建物流和能源系统。。。

Anthropic用这个例子说明,,,,Fable 5可以在一个开放情形里制订战略,,,,并一连推进一个重大系统的建设。。。

在另一个demo里,,,,Fable 5先做了一个基于浏览器的CAD编辑器,,,,然后又使用这个由自己开发的CAD工具,,,,设计了一个可以3D打印的完整模子。。。这个编辑器里还内置了AI copilot,,,,用来辅助建模。。。

这个demo的重点在于Fable 5完成了一个闭环:先创立工具,,,,再使用工具,,,,最后完成一个实体设计使命。。。

最后一个demo,,,,Anthropic展示了一个由Fable 5写出来的流体模拟,,,,运动节奏和一段古典音乐EDM remix同步。。。官方还特意提到,,,,音乐也是Fable 5用代码天生的。。。

这些案例看起来挺花哨,,,,但意思是一样的:Fable 5很善于把代码、视觉、物理、设计和恒久妄想混在一起做使命。。。

若是说这部分展示的照旧Fable 5在开发者手里能做到什么水平,,,,后面的部分说的就是Mythos 5在研究者手里能做什么——以及Anthropic为什么要把Fable和Mythos脱离。。。

Anthropic称,,,,在内部卵白设计专家的评估中,,,,Mythos 5把药物设计流程中的部分环节加速了约莫10倍。。。其中一个案例里,,,,Mythos 5接入卵白设计和生物信息学工具、没有人类资助,,,,就可以匹配甚至凌驾熟练人类操作员。。。

在该使命中,,,,Mythos 5做的不是简朴问答,,,,而是完成一整套科学事情流:选择连系位点,,,,选择并运行卵白设计工具,,,,在失败后自己恢复。。。官方称,,,,在这项研究的14个卵白靶点中,,,,有9个爆发了强候选分子,,,,现在正在进一步研究。。。

Anthropic还提到,,,,Mythos 5可以稳固提出新颖、有吸引力的分子生物学假设。。。在和Opus级模子的盲测比照中,,,,内部科学家约莫80%的时间更偏好Mythos提出的假设,,,,其中一些已经进入实验评估。。。

与此同时,,,,Mythos 5的一个关于大肠杆菌卵白的新机制的假设,,,,在另一家自力研究统一问题的实验室的研究中获得了证实。。。

它甚至还做了一项基因组学研究。。。

Anthropic称,,,,Mythos 5在一周多的时间里,,,,险些自主完成了一项新的基因组学研究。。。它整理了横跨138种动物、数百万个细胞的单细胞数据,,,,并设计、训练了一个定制机械学习模子,,,,用来识别差别物种中执行相同角色的细胞。。。

更夸张的是,,,,Anthropic称,,,,Mythos 5训练出的模子性能凌驾了近期揭晓在《Science》上的一个模子,,,,只管它的规模只有后者的百分之一。。。Anthropic体现,,,,妄想在未来几个月揭晓这些效果。。。

虽然,,,,这部分还需要期待论文和外部复核。。。但若是只看Anthropic官方给出的信息,,,,Mythos 5在生命科学里展示的能力已经靠近科研Agent:能读问题、用工具、处理数据、训练模子、提出假设,,,,并把一项研究推进到可以揭晓的水平。。。

而一旦模子可以在药物设计、病毒载体、卵白设计、基因组学研究这些偏向里真正推进使命,,,,它就自然具备双重用途。。。

可以以为,,,,生命科学这部分不是Fable 5的通俗功效演示,,,,而是Mythos 5的能力上限展示。。。

但它被展示出来,,,,是为了说明Anthropic手里的这套底层模子,,,,已经强到了必需通过受信任会见来分发。。。

有意思的是,,,,已往的模子宣布更像是一件手艺产品的事:参数、跑分、价钱、上下文长度、API名称。。。强就是强,,,,宣布就是宣布。。。

但到了Mythos这里,,,,事情最先变得重大。。。统一个底层模子被分为两个版本,,,,通俗用户拿到的是Fable 5,,,,清静研究者和部学生命科学研究者拿到的是Mythos 5;;;;前者被装进更严酷的护栏里,,,,后者则需要受信任会见。。。

模子能力不再只有崎岖之分,,,,也最先有权限、场景和责任之分。。。

某种意义上来讲,,,,可以看作前沿模子商业化进入新阶段的信号——越强的模子,,,,越不可能直接扔给所有人。。。它们会被拆成差别版本,,,,放进差别清静界线,,,,再交给差别类型的用户。。。

Anthropic先这么做了,,,,由于它们的模子“强到不可完全果真”。。。未来其它想要讲故事的公司,,,,想要证实自己的模子也很强,,,,或许也会效仿这种方式。。。(作者/袁心玥)

记者在华航大厦采访时,,,,许多住民来跟郭大齐打招呼。。。郭大齐说,,,,因其他项目结识的挚友,,,,也会时时邀他去家里品茗、赏花。。。“共创,,,,让我收获了比项目更名贵的工具——与人之间的情绪毗连。。。”

责任编辑:张康宏    校对:詹雅俐

今日热门

  1. 夏国治同志逝世
  2. 美国一空军基地爆发撞机 航行员弹射逃生
  3. 直播海报:高考举行中 | 云端祈福,,,,静候少年佳音
  4. 我国加速研究制订天下一体化算力网手艺标准
  5. 黎真主党称攻击以军目的
  6. 救落水幼儿“垂纶侠”被认意见义勇为
  7. 美国媒体报道称美国与伊朗之间谈判已“取得希望”
  8. 台湾青年:爷爷笔下的“乡愁”是我与大陆的“缘”
  9. 从千年鱼史到生态新篇:江西瑞昌与长江四各人鱼
  10. 时政新闻眼丨北京再聚首,,,,“铁杆朋侪”告竣哪些主要效果? ??

相关推荐

【网站地图】