Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

AI技术研报 2026-06-19 10:18

+10157 阅读

自从上次介绍过 Kimi Work 外加 Fable 无情下线之后，我发现我还真越来越频繁地在使用这个桌面端 APP 了。当然模型能力只是一方面，关键桌面 APP 比起网页来说，在使用上还是要方便得太多了……而且也不用关心网络切来切去啥的。

而昨晚我在让它给我干一件体力活项目时，发现桌面端的左下角弹了个更新提示：

点击更新装完后，发现 Kimi Work 多了个目标（Goal）模式，我用来跑了些任务和测试，然后刚刚看到，官方也正式宣布上线了。

而是个目标模式是指，给它设一个完成条件，它就持续工作，每轮自动检查有没有达标，没搞定就继续下一轮，直到满足了条件才会停。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

Goal 模式入口

这个功能，Claude Code 和 Codex 之前也都有了。但 Kimi Work 的做法有些不同，而且对国内用户来说，门槛要低很多很多。

什么是目标模式

普通模式下，你给 Kimi Work 一个任务，它执行完一轮就结束了。你得看看结果，再手动发下一条指令。所谓 human in loop，然后就会被 AI 给牵住，成为 AI 的工具，然后你就越来越累，患上了 AI 精神病……

目标模式则不一样。

你给的不再是一个任务，而是一个目标。你告诉它：我要什么结果，怎么验证，有什么约束条件。然后它自己去干，干完一轮自动检查，没达标就继续下一轮，直到条件满足或者你主动喊停。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

这就像你是给下属布置工作。以前是一步一步教，任务拆分、过程导向，现在是直接说：「这份报告交付时要满足这三个条件，做完了自己检查，没问题了再交给我。」

目标拆分、结果导向。

我的感受上，这个模式尤其适合让 Agent 帮你熬夜干活，可以称之为：「早 C 晚 A」。

早上 Check 收菜，晚上 Assign 种菜。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

你可以晚上交代好目标和验收标准，它会在你睡觉的时候继续跑。第二天你回来，直接查看进度、验收产物，不用重新开始聊天。

从官方介绍来看，这个模式可以连续工作一天一夜，从而和你无缝对接。

但其实……这对我们的要求反而更高了，你需要从之前具体的执行中抽离出来，而聚焦到更上层的目标拆分和“员工”管理上去。

有经验的都知道，这样虽然更有成就感，但还是挺累人的……（你可能终于有感受了，你天天吐槽不干活的老板，他真是要比你操心得太多了）

实现原理

Claude Code 和 Codex 其实也都有了 /goal 功能。三家的核心思路大体一致：设定目标，自动循环，一旦条件达成，结束。

但在实现层面，三家各有些差异。

Codex 的做法是让工作模型自己做「完成审计」：每轮结束后，系统注入一条指令，要求模型自己检查目标有没有达成。相当于一个人干完活之后自己给自己打分。

Claude Code 换了个思路：干活的和验收的分开。每轮结束后，系统把目标条件和对话记录发给一个独立的小模型（Haiku）来判断，干活的模型看不到评估过程。运动员和裁判分离了。

Kimi Work 的做法是系统在每一轮结束后自动判断目标状态，没完成就继续推进。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

而 Kimi Work 还有一个独特的能力：Agent 集群。

开启目标模式的同时勾选「Agent 集群」，最多可以调度 300 个 Agent 并行协作，和 Claude Code 最新推出的 Workflow 功能有些类似。

这特别适合那些你日常想想就头疼的繁杂之事：一整本书要处理、几十篇论文要整理、一个完整的应用要从零搭建。

一个 Agent 搞不定的，就让 300 个一起上。

共同点则都是：要把人从「盯着每一步」中解放出来，让你只需要定义终点。

如何使用

到 https://www.kimi.com/ 下载 Kimi Work 后，选择「Work」模式，点击输入框左侧的「+」按钮，在弹出菜单中选择「目标」，就开启了 goal 模型。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

开启方式

如果你需要调用 Agent 集群，在右侧勾选「Agent 集群」即可。

一个好的目标条件，通常包含三样东西：

• 一个可衡量的终态：相似度 99%、测试全部通过、文件格式检查清单全绿

• 一个验证方式：比如「跑这个脚本，退出码为 0」

• 不能破坏的约束：比如「不修改其他文件」

也就是说，如果你要处理的任务不符合上面的要求，那就不适合使用目标模式——且往往意味着，你可能还没想清楚要做什么……

好了介绍完了，那实际用起来，效果怎么样呢？

我跑了几个案例。

复刻 Kimi

既然是 Kimi 的新功能，那我就让它，自己来复刻自己！

我把 Kimi 的官方 logo 扔给了 Kimi Work，并设了个目标：

用 SVG 复刻这张图片，写脚本做像素级对比，直到复刻图和原图一模一样。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

Kimi Work 会自动把任务拆解成四步：分析原图、生成 SVG、编写对比脚本、迭代优化。

在右侧的进度面板里，会清楚地列出了每一步的状态，供你更好的了解和监工。

最开始的结果……只有 59% 的相似度，背景透明问题加上 K 字形状不对，差距不小。

但它没有停，因为目标没达成。

第二轮，它修复了背景渲染，相似度跳到了 97.5%。然后它发现纯矢量路径的抗锯齿和原图存在细微差异，怎么调都过不去这道坎。

于是，它又自己切换了技术方案：从纯矢量路径改为三层图像分解，把原图拆成背景层、K 字母层和蓝点层，分别用 Base64 内嵌到 SVG 里。

最终结果：99.9998% 的相似度。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

成果交付

差异只剩 1,082 个像素（总共超过 100 万个），全部集中在图标边缘的抗锯齿过渡带，肉眼完全看不出来。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

差异可视化

整个过程调用了 14 个工具、执行了 41 条命令，中间自主切换了一次技术路线。从 59% 到 99.9998%，没有一次需要我手动干预。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

结果展示

不过怎么讲，虽然搞定，但多少有点点的取巧……

用同样的方式，我又让它复刻了 Claude 的 Logo。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

Claude Logo 复刻文件

Claude 那个放射状渐变图标也是很复杂，Kimi Work 自动写了像素级对比脚本，经过多轮 SVG 版本迭代（从 v1 到 final），生成了十几个中间对比文件。

整个过程同样是全自动的：写代码、跑对比、看结果、改方案，循环往复。

论文格式转换

如果你有搞过学术研究，那你应该会深在体会：不同会议的论文格式要求千差万别，从 NeurIPS 投完想改投 CVPR，光格式转换就能让你折腾上一整个下午。

而且格式问题一旦没弄对，投稿系统直接就给你退回来了，内容好不好、够不够创新都是之后的事……

于是！我拿来了论文《Attention Is All You Need》的 PDF 版本，设了个目标：同时转成 CVPR 2026 和 ICML 2026 两套可编译的 LaTeX 投稿工程，用各自的官方模板，匿名审稿模式，标题、摘要、7 个章节、5 组公式、3 张表格、2 张图、32 条参考文献一个都不能少。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

论文格式转换启动

Kimi Work 先从 PDF 里提取全文和图片，然后分别搭建两套 LaTeX 工程，再用 Tectonic 编译器做实际编译验证。整个过程，共调用了 44 个工具，执行了 53 条命令。

中间它自己还发现了几个问题：ICML 目录下有文件名引用不一致的情况，main.tex 里的表格还被重复引用了。然后一一都进行了修复处理，编译残留文件也一并清理掉。

最终，两套工程都通过了 10 大类格式检查，所有项目全部飘绿打勾。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

论文转换完成

从 PDF 到两套可编译的 LaTeX 投稿工程，中间的格式陷阱全都被 Kimi Work 自动给踩完了。

这种需要反复检查、反复修正的体力活任务，也非常是合适目标模式的场景。

一本漫画书

有一本我一直想推荐的书：《软技能：代码之外的生存指南》。这本书虽然在 ChatGPT 之前我就读过了不止一遍，但在当下的 AI 时代，可以说，更加的值得一读。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

《软技能：代码之外的生存指南》

我在前两天的文章中无中生有地造了个新词叫 3D，来指代 Decide（决策）、Develop（开发）和 Deliver（交付）的三个过程。

我的感受是，中间的 Develop 环节正在被 AI 越来越快速地解决，我们更应该关注和投入的，是另外两个 D 的能力。

而这也恰好是这本书要讲的核心内容：职业规划、自我营销、学习方法、生产力、理财、健康、精神……全是代码之外的事。

但我又发现一个问题：现在 AI 特别擅长生成大篇文字，而习惯了一切均要先看 AI 总结、100 字也要总结，甚至还要看总结的总结、总结的总结的总结……的人们而言，能静下心来读一本书这事，可能已经快成奢侈品了。

那我索性就，把这本书转化为更易读、有趣的格式吧。

我选择了《哆啦 A 梦》的漫画风格。

我在 Kimi Work 里制作了一个 Skill（comic-image-generation），专门用来把书的内容处理成漫画分镜。角色设定是哆啦A梦当导师、大雄当程序员，把书里的核心概念转化为他们之间的互动对话。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

Goal 模式启动

当然，我没有上来就一通猛干（非常不建议）……我先是让它试做了前两章，先调好了效果：

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

第一章漫画版

在确认效果满意后，就直接切到 Goal 模式：

目标：把剩余章节全部完成机器猫的漫画版本制作！

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

Goal 模式启动

我同时还开启了 Agent 集群，这时的场面，就有点儿壮观了。

Kimi Work 自动分配了不同角色：Planner 规划每章的页面结构，Sensei 定义藤子F不二雄的画风标准，ScriptWriter 编写每页的分镜脚本，PromptEngineer 生成文生图的提示词。

甚至还有一个审核角色，专门检查所有脚本的风格一致性。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

Goal 模式执行中

最终，我也不知道过了多久……它终于完事了，交付的是：71 个章节，650 张漫画页面。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

漫画成果

哆啦A梦在黑板前讲课，大雄在旁边做笔记，每一格漫画都对应书里的一个核心概念。

画风统一，分镜完整，文字清晰，有趣又有用，妈妈再也不会担心你不爱学习了。

而考虑到原始图片总量有 1.89 GB，于是我又让 Kimi Work 把图片全部压缩：256 色自适应调色板加 PNG 优化，89 秒处理完 650 张图，从 1.89GB 压到 429.5MB，节省了 77.3%。文字、线条、色块清晰度完全没有损失。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

图片压缩结果

这个压缩，是有点伏笔的，继续往下看就知道了。

需要注意的是，漫画版本虽然包含了书的核心内容，但原书的很多深度和细节是几格漫画无法完全呈现的。

还是建议去看原版，但可以先看漫画版感受下。

一句话 GitHub 开源

漫画书做完了，压缩也搞定了。但，它只在我电脑里。

下一步自然是分享出去，通常作法是用 gh 命令一顿操作。但显然，Kimi Work 早就考虑到了，可以直接用 gihub 插件（这只是众多插件和技能之一）。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

插件中心

不过在开始之前，我发现，原始生成的插画漫画版本中有很多与图片无关的内容，以及过程中的各种 JSON 文件。我想这些内容就没必要发布出去了，所以需要先整理一下。

自然也是，一句话搞定……

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

文件组织

这里不得不感慨一下，遥想起七八年前，我还曾经写过一个桌面端的文件整理工具，功能很简单并没这么复杂，就是把散落各处的文件按规则归类重命名。不太熟悉桌面端开发的我前前后后写了快一个月，而用上之后每周帮我省下来的时间……大概五分钟。

扯远了……言归正传，我切到 Kimi Work 的插件中心装了 GitHub 插件，然后说了一句：

帮我把这个漫画版的书开源到 GitHub，在我个人账号下新建个项目然后 push 上去。

（注意这种活，就别用 goal 模式了，使用场景还是要分清楚，杀鸡不必用上宰牛刀）

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

GitHub 开源

Kimi Work 调出了 GitHub 插件，然后自动创建了仓库 soft-skills-comic，然后把 71 个章节目录、650 张图片，一口气全都推了上去。

仓库地址：https://github.com/Johnixr/soft-skills-comic

一共 71 个章节目录，650 张图片，总计约 431MB。结构完整保留，附带 README 说明。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

开源完成

整个过程没让我输入一次密码、填一次表单、敲一行 git 命令。

我原本还想让它给我做成一个网页然后直接部署好，以方便你在线阅读，但想了想可能会有版权的小问题？就暂时没做这事。

（如果有了解的朋友，请告诉我，要没啥风险，我就把它做个网页出来）

编程即训练

回到 Kimi Work 的目标模式本身。

我之前的文章中有介绍到 Keras 作者 François Chollet 写的一段话：

足够先进的 AI 编程，本质上就是机器学习。

仔细想想，确实如此。

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

我们给 AI 写下需求描述，相当于定义 loss function。在目标模式里写下的验收标准和测试用例，相当于准备验证集。而 Agent 每一轮的迭代，就是一个 training step。

最后产出的代码或交付物，就是训练好的权重。

发现了吗？目标模式，和模型训练，从这个角度来看，其实是一回事。

而目标模式做的事情，就是把这个「训练循环」正式自动化了。你设定优化目标，划定搜索空间的约束，然后一个优化过程自动迭代，直到目标收敛。

一旦意识到了这个等号，我们应该花时间的地方，就需要进行转变了。

我们应该关注的、投入精力的，不再是写代码本身，也不再是手动执行每个步骤。

而是，我的优化目标定对了吗？我的验证标准够不够严？我的约束条件会不会让 Agent 找到投机取巧的捷径，测试全过但逻辑其实是歪的？

这些问题，机器学习领域已经研究了几十年了。过拟合、数据泄露、概念漂移……都是同样的坑。

同样，管理哲学也从另一个角度研究了许多年。

现在，Codex 有 /goal，Claude Code 有 /goal，Kimi Work 有了目标模式。

而对我们而言，真正要考验的能力，正在转变成为：

想清楚自己到底要什么，然后定义好验收标准。

剩下的，交给训练循环，交给 Kimi Work 来完成目标。