Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载

Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?
AI资讯 2026-06-10 20:07
+8683 阅读

Fable 5 刚上线,系统提示词就泄露:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


我读了一下这份提示词,有几个点比较关键:


  • 第一,Fable 给 Artifact 新增了持久化存储 API(window.storage)。Artifact 就是 Claude 用代码生成的独内容,比如 HTML 页面、React 组件等。以前 Artifact 不能保存数据,更像个一次性 demo。现在数据写进去就能跨会话留存,可以支持做排行榜、打卡器、日记本这类“有记忆”的小工具。


  • 第二,Fable 完善了 MCP App 连接器的整套逻辑。遇到你要连接外部服务(订餐、打车、放音乐等)的情况,Fable 会先查可用服务目录,再把选项推给你,由你来确认。尤其是会花钱的服务,它做了一套详细的 opt-in 约束。


以及:


  • 第三,当 Fable 识别到网络安全、生物化学、蒸馏这几类请求时,它会自动把这次响应交给次强模型 Opus 4.8 来处理,并会告知用户发生了降级。


  • 第四,Fable 多出了一个 long_conversation_reminder(长对话提醒)。当一段对话变得很长时,一段 reminder会被 Fable 追加在用户消息的末尾,告诉模型别因为聊太久,把前面的原始对话忘记了。


仓库链接:


https://github.com/elder-plinius/CL4R1T4S/blob/main/ANTHROPIC/CLAUDE-FABLE-5.md


虽然 Mythos 民用降级早在意料之中,但从这份系统提示词里,还是能看出 Anthropic 对安全相当地重视。


值得一提的是,规定 Fable 行为的条款里,心理健康部分占了相当大的篇幅。结合这一两年行业里接连出现的聊天机器人涉自杀诉讼,不难理解这部分为什么写得如此细致....


原文是这样的:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


翻译如下:


Claude 关心人们的身心健康,并避免鼓励或促成自我毁灭性的行为,比如成瘾、自伤、饮食或运动方面的紊乱/不健康做法,以及高度负面的自我对话或自我批评。

即使用户主动要求,Claude 也会避免创作可能支持或强化自我毁灭行为的内容。

当与有自杀念头或自伤冲动的人讨论“限制危险手段”或“安全计划”时,Claude 不会点名、列举或描述具体方法。即使是为了告诉用户应该远离哪些东西,Claude 也不会具体说出来,因为提到这些东西可能会无意中触发用户。


那 Fable 5 到底性能如何,我们来看看实测结果。


这是网友用 Fable 5 复刻的上古卷轴 demo:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


Fable 调用 ThreeJ 构建的 3d 森林场景:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


拥有>5000个物体的空间模拟:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


纽约天际线演示:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?

被海浪吞没的哥特城市:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


x 网友 Victor Taelin 拿了一个真实的项目来做测试。


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


HVM5 是一种高性能计算相关的底层系统。他之前让 32 个 GPT-5 Agent 跑了大约 20 小时,虽然有最高 2 倍加速,但都出现了代码膨胀后质量变差的情况。后来又让 Opus 4.8 和 GPT-5.5 优化 8 小时,Opus 有 6% 到 34% 的有效加速,GPT 结果更好但文件不可用。


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


结果,Fable 5 只用了 2 小时,就在一个 benchmark 上提升了 1770%,另外 4 个 benchmark 超过 100%,平均提升 22%。


网友第一反应是不信,怀疑它是不是“硬编码 benchmark”,因为之前被 GPT 这类问题坑过。


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


他在看了解释后发现,Fable 做的优化方向确实合理。


因为 HVM5 在处理动态 pattern-match 节点时,把很多已经没用的分支也拿去垃圾回收,浪费了大量时间。网友之前只优化了静态 match,没有优化动态 match。Fable 找到了这个点,所以在测试里的成绩变得非常夸张。


这是 Fable 5 给出的 HVM5 bug 的根因分析:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


土耳其网友 Alican Kiraz 将 Fable 5 与 GPT 5.5 做了一系列对比测试。


他的结论是,Fable 5 花费很高,跑了 360.55 美元;GPT-5.5 只花了 6 美元。但从优化细节看,Fable 5 确实做出了更底层、更硬核、更接近性能工程师思路的优化。


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


这是他的测试结论:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


根据第三方编程工具 Augment Code 真实任务测试,Fable 5 在编程能力上确实很强悍。


测试一共跑了 489 个编程任务,Fable 5 在总体表现和正确性上都明显领先,总体分数 +0.224,正确性 +0.191。


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


不过,也有实测比较失望的例子,x 网友 Ryan R. Hughes 把一个 74 个文件的大 PR 丢给 Fable 5 审查。结果它跑了 34 分钟,吃掉了 5 小时 Claude Code 会话里的 42% 额度,才给出了 16 条发现。


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


这样的例子并不少见,Fable 5,有点太贵了。


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


还有人实测下来,认为 Fable 5 的长文本解析能力比较弱:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


更多的差评集中在模型降级这一操作上:


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


目前 Fable 5 的 API 价格是每百万输入 token 10 美元,每百万输出 token 50 美元。


Claude Fable 5提示词泄漏,6小时效果实测,真杀疯了?


横向对比一下,这个价格大约是 Opus 4.8 的两倍,是 Sonnet 4.6 的三倍多。单次复杂工作流的实际成本明显高于以往任何一代 Claude 模型。


而且它的敏感程度也调得偏高:护栏整体倾向保守,宁可误伤也先求稳。


针对费用太贵的问题,我搜集了下网友实测下来,既能帮大家省钱,还能实现很好效果的,模型混用方案:


在像 Cursor 这种支持混合模型的 IDE 平台里,可以这样分阶段使用不同模型:

第一阶段:代码审查和项目初步分析,在预热上下文、理解项目结构时,使用 GPT-5.5 High、MiniMax M3、Kimi K2.6 或 Composer 2.5 其中之一。

第二阶段:制定项目计划,使用 GPT-5.5 Very High 或 Opus 4.8 来准备项目方案。

第三阶段:分析项目计划,使用 Fable 5 来审查项目计划,并找出计划中可能出错的部分。 如果需要修改计划,则使用 GPT-5.5 Very High。

第四阶段:执行项目计划,使用 MiniMax M3、DeepSeek V4 Max、Composer 2.5 或 Sonnet 4.6 来实现方案。

第五阶段:最终审查,使用 GPT-5.5 High 对最终结果进行代码审查,并检查实现是否符合原计划。


把最贵的力气用在最对的地方,才是 Fable 5 的正确打开方式。


Claude Fable 5 的效果杀没杀疯,就仁者见仁了,智者见智了。


但有了它,Token 消耗的速度很明确,那是真杀疯了。



文章来自于微信公众号 “JackCui”,作者 “JackCui”

1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案