Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载

Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源
AI技术研报 2026-06-19 10:18
+9154 阅读

自从上次介绍过 Kimi Work 外加 Fable 无情下线之后,我发现我还真越来越频繁地在使用这个桌面端 APP 了。当然模型能力只是一方面,关键桌面 APP 比起网页来说,在使用上还是要方便得太多了……而且也不用关心网络切来切去啥的。


而昨晚我在让它给我干一件体力活项目时,发现桌面端的左下角弹了个更新提示:


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源


点击更新装完后,发现 Kimi Work 多了个目标(Goal)模式,我用来跑了些任务和测试,然后刚刚看到,官方也正式宣布上线了。


而是个目标模式是指,给它设一个完成条件,它就持续工作,每轮自动检查有没有达标,没搞定就继续下一轮,直到满足了条件才会停。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

Goal 模式入口


这个功能,Claude Code 和 Codex 之前也都有了。但 Kimi Work 的做法有些不同,而且对国内用户来说,门槛要低很多很多。


什么是目标模式


普通模式下,你给 Kimi Work 一个任务,它执行完一轮就结束了。你得看看结果,再手动发下一条指令。所谓 human in loop,然后就会被 AI 给牵住,成为 AI 的工具,然后你就越来越累,患上了 AI 精神病……


目标模式则不一样。


你给的不再是一个任务,而是一个目标。你告诉它:我要什么结果,怎么验证,有什么约束条件。然后它自己去干,干完一轮自动检查,没达标就继续下一轮,直到条件满足或者你主动喊停。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源


这就像你是给下属布置工作。以前是一步一步教,任务拆分、过程导向,现在是直接说:「这份报告交付时要满足这三个条件,做完了自己检查,没问题了再交给我。」


目标拆分、结果导向。


我的感受上,这个模式尤其适合让 Agent 帮你熬夜干活,可以称之为:「早 C 晚 A」


早上 Check 收菜,晚上 Assign 种菜。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源


你可以晚上交代好目标和验收标准,它会在你睡觉的时候继续跑。第二天你回来,直接查看进度、验收产物,不用重新开始聊天。


从官方介绍来看,这个模式可以连续工作一天一夜,从而和你无缝对接。


但其实……这对我们的要求反而更高了,你需要从之前具体的执行中抽离出来,而聚焦到更上层的目标拆分和“员工”管理上去。


有经验的都知道,这样虽然更有成就感,但还是挺累人的……(你可能终于有感受了,你天天吐槽不干活的老板,他真是要比你操心得太多了)


实现原理


Claude Code 和 Codex 其实也都有了 /goal 功能。三家的核心思路大体一致:设定目标,自动循环,一旦条件达成,结束。


但在实现层面,三家各有些差异。


Codex 的做法是让工作模型自己做「完成审计」:每轮结束后,系统注入一条指令,要求模型自己检查目标有没有达成。相当于一个人干完活之后自己给自己打分。


Claude Code 换了个思路:干活的和验收的分开。每轮结束后,系统把目标条件和对话记录发给一个独立的小模型(Haiku)来判断,干活的模型看不到评估过程。运动员和裁判分离了。


Kimi Work 的做法是系统在每一轮结束后自动判断目标状态,没完成就继续推进。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源


而 Kimi Work 还有一个独特的能力:Agent 集群。


开启目标模式的同时勾选「Agent 集群」,最多可以调度 300 个 Agent 并行协作,和 Claude Code 最新推出的 Workflow 功能有些类似。


这特别适合那些你日常想想就头疼的繁杂之事:一整本书要处理、几十篇论文要整理、一个完整的应用要从零搭建。


一个 Agent 搞不定的,就让 300 个一起上。


共同点则都是:要把人从「盯着每一步」中解放出来,让你只需要定义终点。


如何使用


到 https://www.kimi.com/ 下载 Kimi Work 后,选择「Work」模式,点击输入框左侧的「+」按钮,在弹出菜单中选择「目标」,就开启了 goal 模型。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

开启方式


如果你需要调用 Agent 集群,在右侧勾选「Agent 集群」即可。


一个好的目标条件,通常包含三样东西:


•  一个可衡量的终态:相似度 99%、测试全部通过、文件格式检查清单全绿 


•  一个验证方式:比如「跑这个脚本,退出码为 0」 


•  不能破坏的约束:比如「不修改其他文件」 


也就是说,如果你要处理的任务不符合上面的要求,那就不适合使用目标模式——且往往意味着,你可能还没想清楚要做什么……


好了介绍完了,那实际用起来,效果怎么样呢?


我跑了几个案例。


复刻 Kimi


既然是 Kimi 的新功能,那我就让它,自己来复刻自己!


我把 Kimi 的官方 logo 扔给了 Kimi Work,并设了个目标:


用 SVG 复刻这张图片,写脚本做像素级对比,直到复刻图和原图一模一样。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源


Kimi Work 会自动把任务拆解成四步:分析原图、生成 SVG、编写对比脚本、迭代优化。


在右侧的进度面板里,会清楚地列出了每一步的状态,供你更好的了解和监工。


最开始的结果……只有 59% 的相似度,背景透明问题加上 K 字形状不对,差距不小。


但它没有停,因为目标没达成。


第二轮,它修复了背景渲染,相似度跳到了 97.5%。然后它发现纯矢量路径的抗锯齿和原图存在细微差异,怎么调都过不去这道坎。


于是,它又自己切换了技术方案:从纯矢量路径改为三层图像分解,把原图拆成背景层、K 字母层和蓝点层,分别用 Base64 内嵌到 SVG 里。


最终结果:99.9998% 的相似度。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

成果交付


差异只剩 1,082 个像素(总共超过 100 万个),全部集中在图标边缘的抗锯齿过渡带,肉眼完全看不出来。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

差异可视化


整个过程调用了 14 个工具、执行了 41 条命令,中间自主切换了一次技术路线。从 59% 到 99.9998%,没有一次需要我手动干预。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

结果展示


不过怎么讲,虽然搞定,但多少有点点的取巧……


用同样的方式,我又让它复刻了 Claude 的 Logo。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

Claude Logo 复刻文件


Claude 那个放射状渐变图标也是很复杂,Kimi Work 自动写了像素级对比脚本,经过多轮 SVG 版本迭代(从 v1 到 final),生成了十几个中间对比文件。


整个过程同样是全自动的:写代码、跑对比、看结果、改方案,循环往复。


论文格式转换


如果你有搞过学术研究,那你应该会深在体会:不同会议的论文格式要求千差万别,从 NeurIPS 投完想改投 CVPR,光格式转换就能让你折腾上一整个下午。


而且格式问题一旦没弄对,投稿系统直接就给你退回来了,内容好不好、够不够创新都是之后的事……


于是!我拿来了论文《Attention Is All You Need》的 PDF 版本,设了个目标:同时转成 CVPR 2026 和 ICML 2026 两套可编译的 LaTeX 投稿工程,用各自的官方模板,匿名审稿模式,标题、摘要、7 个章节、5 组公式、3 张表格、2 张图、32 条参考文献一个都不能少。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

论文格式转换启动


Kimi Work 先从 PDF 里提取全文和图片,然后分别搭建两套 LaTeX 工程,再用 Tectonic 编译器做实际编译验证。整个过程,共调用了 44 个工具,执行了 53 条命令。


中间它自己还发现了几个问题:ICML 目录下有文件名引用不一致的情况,main.tex 里的表格还被重复引用了。然后一一都进行了修复处理,编译残留文件也一并清理掉。


最终,两套工程都通过了 10 大类格式检查,所有项目全部飘绿打勾。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

论文转换完成


从 PDF 到两套可编译的 LaTeX 投稿工程,中间的格式陷阱全都被 Kimi Work 自动给踩完了。


这种需要反复检查、反复修正的体力活任务,也非常是合适目标模式的场景。


一本漫画书


有一本我一直想推荐的书:《软技能:代码之外的生存指南》。这本书虽然在 ChatGPT 之前我就读过了不止一遍,但在当下的 AI 时代,可以说,更加的值得一读。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

《软技能:代码之外的生存指南》


我在前两天的文章中无中生有地造了个新词叫 3D,来指代 Decide(决策)、Develop(开发)和 Deliver(交付)的三个过程。


我的感受是,中间的 Develop 环节正在被 AI 越来越快速地解决,我们更应该关注和投入的,是另外两个 D 的能力。


而这也恰好是这本书要讲的核心内容:职业规划、自我营销、学习方法、生产力、理财、健康、精神……全是代码之外的事。


但我又发现一个问题:现在 AI 特别擅长生成大篇文字,而习惯了一切均要先看 AI 总结、100 字也要总结,甚至还要看总结的总结、总结的总结的总结……的人们而言,能静下心来读一本书这事,可能已经快成奢侈品了。


那我索性就,把这本书转化为更易读、有趣的格式吧。


我选择了《哆啦 A 梦》的漫画风格。


我在 Kimi Work 里制作了一个 Skill(comic-image-generation),专门用来把书的内容处理成漫画分镜。角色设定是哆啦A梦当导师、大雄当程序员,把书里的核心概念转化为他们之间的互动对话。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

Goal 模式启动


当然,我没有上来就一通猛干(非常不建议)……我先是让它试做了前两章,先调好了效果:


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

第一章漫画版


在确认效果满意后,就直接切到 Goal 模式:


目标:把剩余章节全部完成机器猫的漫画版本制作!


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

Goal 模式启动


我同时还开启了 Agent 集群,这时的场面,就有点儿壮观了。


Kimi Work 自动分配了不同角色:Planner 规划每章的页面结构,Sensei 定义藤子F不二雄的画风标准,ScriptWriter 编写每页的分镜脚本,PromptEngineer 生成文生图的提示词。


甚至还有一个审核角色,专门检查所有脚本的风格一致性。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

Goal 模式执行中


最终,我也不知道过了多久……它终于完事了,交付的是:71 个章节,650 张漫画页面。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

漫画成果


哆啦A梦在黑板前讲课,大雄在旁边做笔记,每一格漫画都对应书里的一个核心概念。


画风统一,分镜完整,文字清晰,有趣又有用,妈妈再也不会担心你不爱学习了。


而考虑到原始图片总量有 1.89 GB,于是我又让 Kimi Work 把图片全部压缩:256 色自适应调色板加 PNG 优化,89 秒处理完 650 张图,从 1.89GB 压到 429.5MB,节省了 77.3%。文字、线条、色块清晰度完全没有损失。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

图片压缩结果


这个压缩,是有点伏笔的,继续往下看就知道了。


需要注意的是,漫画版本虽然包含了书的核心内容,但原书的很多深度和细节是几格漫画无法完全呈现的。


还是建议去看原版,但可以先看漫画版感受下。


一句话 GitHub 开源


漫画书做完了,压缩也搞定了。但,它只在我电脑里。


下一步自然是分享出去,通常作法是用 gh 命令一顿操作。但显然,Kimi Work 早就考虑到了,可以直接用 gihub 插件(这只是众多插件和技能之一)。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

插件中心


不过在开始之前,我发现,原始生成的插画漫画版本中有很多与图片无关的内容,以及过程中的各种 JSON 文件。我想这些内容就没必要发布出去了,所以需要先整理一下。


自然也是,一句话搞定……


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

文件组织


这里不得不感慨一下,遥想起七八年前,我还曾经写过一个桌面端的文件整理工具,功能很简单并没这么复杂,就是把散落各处的文件按规则归类重命名。不太熟悉桌面端开发的我前前后后写了快一个月,而用上之后每周帮我省下来的时间……大概五分钟。


扯远了……言归正传,我切到 Kimi Work 的插件中心装了 GitHub 插件,然后说了一句:


帮我把这个漫画版的书开源到 GitHub,在我个人账号下新建个项目然后 push 上去。


(注意这种活,就别用 goal 模式了,使用场景还是要分清楚,杀鸡不必用上宰牛刀)


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

GitHub 开源


Kimi Work 调出了 GitHub 插件,然后自动创建了仓库 soft-skills-comic,然后把 71 个章节目录、650 张图片,一口气全都推了上去。


仓库地址:https://github.com/Johnixr/soft-skills-comic


一共 71 个章节目录,650 张图片,总计约 431MB。结构完整保留,附带 README 说明。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源

开源完成


整个过程没让我输入一次密码、填一次表单、敲一行 git 命令。


我原本还想让它给我做成一个网页然后直接部署好,以方便你在线阅读,但想了想可能会有版权的小问题?就暂时没做这事。


(如果有了解的朋友,请告诉我,要没啥风险,我就把它做个网页出来)


编程即训练


回到 Kimi Work 的目标模式本身。


我之前的文章中有介绍到 Keras 作者 François Chollet 写的一段话:


足够先进的 AI 编程,本质上就是机器学习。


仔细想想,确实如此。


Kimi Work 推出目标模式:连肝 24 小时做了本漫画书,已开源


我们给 AI 写下需求描述,相当于定义 loss function。在目标模式里写下的验收标准和测试用例,相当于准备验证集。而 Agent 每一轮的迭代,就是一个 training step。


最后产出的代码或交付物,就是训练好的权重。


发现了吗?目标模式,和模型训练,从这个角度来看,其实是一回事。


而目标模式做的事情,就是把这个「训练循环」正式自动化了。你设定优化目标,划定搜索空间的约束,然后一个优化过程自动迭代,直到目标收敛。


一旦意识到了这个等号,我们应该花时间的地方,就需要进行转变了。


我们应该关注的、投入精力的,不再是写代码本身,也不再是手动执行每个步骤。


而是,我的优化目标定对了吗?我的验证标准够不够严?我的约束条件会不会让 Agent 找到投机取巧的捷径,测试全过但逻辑其实是歪的?


这些问题,机器学习领域已经研究了几十年了。过拟合、数据泄露、概念漂移……都是同样的坑。


同样,管理哲学也从另一个角度研究了许多年。


现在,Codex 有 /goal,Claude Code 有 /goal,Kimi Work 有了目标模式。


而对我们而言,真正要考验的能力,正在转变成为:


想清楚自己到底要什么,然后定义好验收标准。


剩下的,交给训练循环,交给 Kimi Work 来完成目标。


相关链接:


Kimi 下载:https://www.kimi.com/products/kimi-work


Kimi Work 官方上新公告:https://mp.weixin.qq.com/s/cr49fkk5ud7Tu3JQYCb8Ew


漫画书 GitHub 仓库:https://github.com/Johnixr/soft-skills-comic


文章来自于"AGI Hunt",作者 "尹John"。

1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案