今天凌晨,Anthropic 发布新模型 Fable 5,毫无疑问的,也是当下的最强模型

这时候,手机前、刚起床的彦祖可能会问:不是说发的是 Mythos 么?这个 Fable 是啥?其实啊,Mythos 和 Fable 底层是同一个模型,区别在于护栏:
$25/百万 token输入,$125/百万 token输出$10/百万 token输入、$50/百万 token输出(刚好比 opus 4.8 贵一倍)Pro、Max、Team 和按席位的 Enterprise Plan 用户,在6 月 22 号之前都能够使用到 Fable 5(消耗同等用量 Opus 两倍额度),之后要花 usage credits,API 今天就完全可用,模型名称叫做claude-fable-5

这里我也浅浅试了一下,体感上确实不错
但是...注意,我说但是了,对于护栏的存在,很多的任务拒绝完成,然后强行退回 Opus 4.8

如果是 Claude Code,它则会回复说
Request was blocked
This request triggered safety guardrails. Rephrase your prompt or rewind to continue.
Anthropic 说触发率不到 5%,我的实际感受远高于这个数字,以至于到目前为止我还没能完整地跑通一个「全程由 Fable 回答」的任务,同时,我发现自己并非唯一的幸运儿
比如下面这个,生物学家对 fable 5 说 hi,然后被拒绝...原因是记忆里面包含相关的生物信息,判定为风险...然后如果开启了隐身模式,就能正常 say hi 了,这就尼玛...

所以吧...真可能是我各种奇奇怪怪的事儿做多了,系统觉得「此子必不可留」,让我获得了足够的「不配得感」,所以这篇文章里关于能力的部分,大部分来自官方数据和早期测试客户的反馈,来自官方公告
公告地址:anthropic.com/news/claude-fable-5-mythos-5

http://anthropic.com/news/claude-fable-5-mythos-5
前文提到:Mythos 和 Fable 背后是同一个模型,区别在于护栏
套护栏叫 Fable,没限制的叫 Mythos
而至于名字,Mythos 是希腊语的「神话」;Fable 来自法语的 Fabula 也就是「被讲述的东西」,意思也比较相近
Mythos 级是 Anthropic 在 Opus 之上新立的一个能力层级。今年四月,他们通过 Project Glasswing(玻璃翼计划?这个也没啥正式翻译)放出了第一个 Mythos 级模型 Claude Mythos Preview,只给一小撮网络安全防御者和关键软件基建方
当时就说了,等护栏做好了,会把 Mythos 级开放给所有人,也就有了 Fable
至此,A 社的模型能力排行如下:
正版 Mythos > Fable > Opus > Sonnet > Haiku
毫无疑问,根据「越新的头部模型越强」的普遍原则,叠加 Falbe/Mythos 是 Claude 家的最强序列,Fable 5 几乎在所有测试基准上都是当前最强,任务越长越复杂,它甩开其他模型越远
比如:Stripe 拿 Fable 5 跑了一个五千万行的 Ruby 代码库的全库迁移, 一天做完。同样的活儿,一个团队手工干要两个多月。Fable 5 还比过去的 Claude 更省 token,同样的难题花的钱更少。在 Cognition 的 FrontierCode 评测上,它在中等推理强度下就拿了前沿模型里的最高分

拿到早期权限的客户各自跑了测试,挑几句看看口径:Cursor 的 Michael Truell 说它在 CursorBench 上是最强模型,打开了一类过去够不着的长周期问题。GitHub 的 Mario Rodriguez 说它接复杂的长周期编码任务,自主性和可靠性超过了之前的基准。Cognition 的 Scott Wu 说它是 FrontierBench 上得分最高的模型,开箱就能泛化到陌生工具。Replit 的 Michele Catasta 说它在自家的 vibe-coding 评测上几乎跑满

作为宗门的新一代天骄,Fable 5 它是通关了宝可梦的
过去的 Claude 玩宝可梦,是得搭一套辅助 harness,负责喂各种游戏状态。Fable 5 只看原始截图,就把《宝可梦 火红》从头打到尾通关了,这个水平,直指当年还在接受九年义务教育的我,不愧是宗门天骄

之前那套喂地图喂状态的 harness,不再必要了
它还能从科学图表里抠出精确数字,看几张截图就把一个网页应用的源码重建出来
记忆和长上下文也上了一个台阶,比如让它玩《杀戮尖塔》,给它一份持久存取的文件当记忆,成绩提升是 Opus 4.8 的三倍,打到最终幕的次数也是三倍...这怎么玩的游戏和我一样,不愧是能与我比肩的斗宗强者


至于剩下的,Anthropic 放了四个 demo,我一个一个贴
第一个,它从物理第一性原理推导行星轨道运动,拿这个预测日食

日食模拟,从万有引力开始算的
第二个,它自己玩《异星工厂》Factorio,自己规划策略、自己把自动化流水线搭起来

很休闲的一款游戏,推荐大家试试
这个游戏好啊,益智、提神、醒脑,和我一样喜欢玩这个游戏,难怪 Fable 这么聪明

第三个,它在浏览器里的 CAD 编辑器里设计了一个完整的可 3D 打印模型。那个 CAD 编辑器也是它造的,包括里面的 AI copilot

编辑器是它造的,模型也是它设计的
第四个,它写代码做了一段流体模拟,流体的运动卡上一首古典 EDM remix 的节拍。那首 remix 也是它用代码生成的,它从没听过音乐

从没听过音乐,用代码作了首 EDM
知识工作方面,Hebbia 面向资深推理的金融评测里,Fable 5 拿了所有模型的最高分。IMC 说它的交易分析评测几乎全项满分
Mythos 5 在生物科研上做到的事,跑分表格装不下了
先说药物设计。Anthropic 内部的蛋白设计专家用 Mythos 5,把药物设计过程的部分环节加速了约十倍。有一个例子,Mythos 5 拿着蛋白设计和生物信息学工具,在无人干涉下,做到了匹配甚至超过熟练的人类操作者,把项研究里的 14 个蛋白靶点,9 个产出了值得继续做药的强候选

免疫检查点、神经退行、肌肉病这些靶点,9 个出了强候选
Mythos 5 是 Anthropic 第一个能稳定产出新颖且站得住脚的科学假设的模型。在盲测对比里,科学家有大约八成的时候更偏好 Mythos 的分子生物学假设而不是 Opus 级模型的。对于实验假设,有些已经出成果了:比如一个关于大肠杆菌某蛋白的新机制,已被相关实验室的研究证实了
基因组学那边,Mythos 5 在超过一周的大体自主的工作里做了一项新研究。它把横跨 138 个动物物种、数百万个细胞的单细胞数据组装起来,自己设计并训练了一个机器学习模型,用来识别在亲缘很远的物种里执行相同功能的细胞
Mythos 训出来的这个模型,超过了最近发表在 Science 上的一个模型,体积还小了 100 倍,结果计划未来几个月发表
可能我的记忆里的信息比较诡异,导致简单的任务我能跑

复杂的请求就被退回

背后 Anthropic 给 Fable 5 套了一组分类器,单独的 AI 系统,盯着每一轮对话,判断你的请求有没有碰到三个区域:网络安全、生物化学、蒸馏。碰到了就把球扔给 Opus 4.8
Anthropic 说平均触发率在 5% 以下,超过 95% 的会话完全不触发。但这个数字是按会话数算的,发个「hi」也算一个会话。真拿它干活,尤其是长任务,体感完全是另一回事
任务一长,中间某一轮碰了分类器,整个对话就从 Fable 切到了 Opus,后面的回答都是 Opus 4.8 在给你稳稳接住
再比如我的历史记忆比较复杂,可能就会莫名其妙的被视作宗门细作,退回的时候界面顶上会顶出一行「Switched to Opus 4.8」,右边给你一个「Edit and retry with Fable 5」,让你改改话术再撞一次护栏
就比如下面这个极为正常的工作:翻译全文:https://www.anthropic.com/news/claude-fable-5-mythos-5

Edit and retry 这词起得讲究...
Claude Code 那边也一样,碰到护栏就直接弹 Request was blocked,让你改问题或者回退
再说回 Fable 的三类拒绝回答
第一类是网络安全。Mythos 级模型擅长找漏洞、利用漏洞,还会做 agentic hacking,把侦察、横向移动这些环节自己串起来。护栏直接让 Fable 在这类任务上做不出任何进展

Anthropic 做了大量红队测试,外部 bug bounty 跑了超过 1000 小时没找到通用越狱,外部红队在长周期 agentic 任务上也没找到,只有英国 AISI 在一个很短的初始窗口里有所进展

一家外部合作方测下来,Fable 5 在有害网络请求上的护栏是所测全部模型里最硬的,比 Opus 4.8 和 4.7 都硬,对 30 种公开越狱技术零突破
第二类是生物和化学。过去只挡很窄的一撮生物武器问题,现在 Anthropic 觉得不够了。他们测了 Mythos 5 预测一种病毒外壳组装的能力(用的是 Dyno Therapeutics 未发表的候选),那是设计基因治疗载体 AAV 的一步,同样的本事换个人用就能拿去设计危险病毒

Mythos 级模型光靠生物推理就超过了专门做蛋白任务的蛋白语言模型。为了尽快安全发布,眼下 Fable 把大部分生物化学请求都退回给了 Opus 4.8,往后会慢慢收窄
第三类是蒸馏。Anthropic 此前发现过大规模的蒸馏企图,而之后这些行为,会被分类器标记为蒸馏,然后退回 Opus 4.8
还有一处变化跟企业客户直接相关。Mythos 级模型的所有流量,无论是 Anthropic 自家界面还是第三方,都要求 30 天数据保留
这些数据不拿去训练、不做安全以外的用途,会记录所有人类访问,30 天后删除
打开网页版会先弹一个框,告诉你 Fable 5 在 6 月 22 号之前算在套餐额度里,但它吃额度是 Opus 的两倍。6 月 23 号起从订阅计划里撤掉,之后要用得花 usage credits
等容量够了,再把它恢复成订阅计划的标准配置

吃 Opus 两倍额度,6 月 23 号起这部分得自己掏 credits
网页版的模型列表里能直接选到 Fable 5,旁边标着「Included until June 22」。Claude Code 那边,无论是 terminal 还是 Claude 应用,列表里默认看不到它,得手动敲 /model claude-fable-5 才能切过去

网页里能选到,Claude Code 里得敲 /model claude-fable-5 才出来
平台这边,claude-fable-5 在 Claude API、AWS 上的 Claude Platform、Amazon Bedrock、Vertex AI、Microsoft Foundry 都能调
Mythos 5 则不公开,只给 Glasswing 的合作伙伴(拆了网络安全护栏),以及不久后选定的一批生物研究者(拆了生物化学护栏)。Anthropic 说会跟美国政府一起,稳步扩大 Mythos 5 的可信访问名单,还要开一个让网络安全机构系统化申请的通道,另开一个面向生物研究的通道
文章来自于"赛博禅心",作者 "金色传说大聪明"。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0