300 个 AI 和我的八块腹肌

AI资讯 2026-06-09 10:01

+8281 阅读

要说这段时间的热门 AI 产品，Codex 必然是绕不过去的话题。

这个一开始只是给开发者用来做代码补全、项目管理、功能开发的编程平台，到现在已成长为一款适用于任何角色、工具和工作流程，且人人都能使用的生产力工具。

300 个 AI 和我的八块腹肌

OpenAI 在《知识工作的下一个时代》报告里提到，Codex 目前周活用户超过 500 万，自从今年 2 月上线桌面版 APP 后增长了 6 倍多。用户画像方面，虽然开发者仍然是 Codex 最大的用户群体，但知识工作者目前约占用户总数的 20%，并且增长速度是开发者的三倍多。

越来越多人发现，虽然 Claude Code、Codex，都是叫 Code（代码），但这些 Agent 不只是会写代码；它们还能整理文件、分析数据、搜索资料、自动跑工作流，甚至替我们完成一整个项目里的重复劳动。

早在 OpenClaw 火爆的时期，其实就有类似的趋势，但是龙虾的安装和部署劝退了很多人。叫好的多，真用起来的没几个。这类工具一直卡在同一道坎上，只有会折腾的人玩得转，普通人连门都进不去。

对大多数国内用户来说，Codex 算是第一个真正迈过这道坎的，虽然 Claude Code 在它之前，但 Claude 难用上，Codex 一键安装，加上接连的体验优化，把 Coding Agent 从程序员的玩具变成了普通人也能上手的东西。

300 个 AI 和我的八块腹肌

究其本质，都是将从前单一的 Agent 演变成 Agent Team，甚至是一整套高达上百个 Agents 的动态工作流。

Kimi 最近推出了 Kimi Work，也是建立在这个趋势之上的一次尝试；其核心逻辑，就是把底层的 Agent Swarm 模型能力，用可视化界面进行封装，放到了本地电脑上。

大到工作中需要 300 个 Agents 并行处理的复杂任务，小到平时繁琐的文件整理、操作浏览器等等，都能通过这支 Agent 队伍在后台挂机完成。

开启 300 个 AI 分身

Kimi Work 最大的优点是 Agent 集群的能力放到了本地 Agent 上；而为了让 Agent Swarm 真正工作起来，Kimi Work 提供了多项实用能力。

本地文件深度连接，可直接读取和管理本地文件夹，安全护栏机制要求在修改文件前需用户授权。

7×24 小时定时任务（Cron 引擎），支持按设定时间自动执行 LLM 对话请求、Python/Shell 脚本等，如清晨生成简报或夜间清洗数据，可保持电脑唤醒以确保任务运行。

WebBridge 浏览器自动化，通过自然语言指令让 AI 自主操作浏览器，实现跨网页信息检索、深层数据抓取、自动填写表单等。

原生接入全球金融市场数据，直接打通 A 股、港股、美股等核心数据源，可在对话中调取财报、分析盘面、进行跨表对账，辅助投资决策。

300 个 AI 和我的八块腹肌

我们先是使用现有的本地文件夹创建项目，在该项目内新建任务，要求 Kimi Work 帮我们整理 20 家值得关注的 AI 公司，分析它们的产品定位、融资动态、核心竞争力等信息，并给出网页报告、PPT 等内容。

选择 K2.6 Agent 集群开始任务，Kimi 会自动给任务设置对应的进度，并且使用 Subagent 工具调用多个 Agents 来处理。

展开任务过程，可以看到有研究组 1-大厂 AI、研究组 2-新锐大模型、研究组 3-基础设施，以及研究组 4-AI 应用 4 个研究 Agent 去搜集和分析对应公司的资料。

300 个 AI 和我的八块腹肌

而调用 Skill 这些都是基本操作，从右侧的上下文部分，我们能看到 Kimi 调用了报告撰写、可视化、集群深度研究、前端主题等来帮助它完成任务。

最后我们得到的分析报告也非常全面，数据表、可视化分析和具体的公司介绍都囊括在里面。

更有意思的是，每家公司的详情部分都写着一句「风险」，Kimi 给自己的定位是「估值上涨过快，盈利拐点不明」，而核心竞争力是「长文本、编程能力、智能体、开源领先。」

300 个 AI 和我的八块腹肌

除了这种常见的深度研究任务，有了 Kimi Work，我们现在可以直接让它处理本地的文件。最简单的先让它帮我整理一下最近 30 天内的文件，使用对应的工具查看文件内容，汇总这些文件的信息。

300 个 AI 和我的八块腹肌

从右侧的进度可以看到它会读取文本文件内容，也能提取 PDF 文件、查看图片文件以及处理 Office 文件等，最后生成的表格也成功列举了所有的文件内容和对应的信息。

300 个 AI 和我的八块腹肌

我们找了一份会议记录，并搜集了一些论文资料和图片数据，累计本地的文件数量达到了十余个。过去使用云端的 Kimi，我们要一个个上传这些文件到网页，现在 Kimi Work 可以直接选择该文件夹作为一个项目，开始 Agent Swarm 进行处理。

300 个 AI 和我的八块腹肌

我们要求它使用 K2.6 Agent 集群来启动并行协作，根据文件夹内的资料，完成行业研究、论文综述、产品策略、技术架构、合规治理、财务测算、PPT 设计、Word 报告、PDF 研究报告、Excel 模型和质量审查等多份文档。

由于涉及的文件过多，Kimi K2.6 Agent 集群这次启动了多个阶段来完成，像是在研究分析的第一阶段，它就找来了行业研究员、论文综述员、产品策略师、技术架构师、合规治理专家以及财务测算师 6 个 Agent。

300 个 AI 和我的八块腹肌

在第二步，Kimi 又找来了 PPT 设计师、Word 报告员、PDF 研究员和 Excel 建模师 4 个 Agent 来完成整合交付。整合交付之后，还会自动开启质量审查，利用质量审查员和网页开发师两个子 Agent 对之前的内容进行最终确认。

300 个 AI 和我的八块腹肌

最后，Kimi Work 产出了六份文字报告、一份测算模型，以及用于汇报的 HTML 和 PPT 文档。

300 个 AI 和我的八块腹肌

随便点开其中一份文档，Kimi Work 都不是随便应付，从内容到格式都符合直接交付的标准。

300 个 AI 和我的八块腹肌

在 Kimi Work 的回复里，Kimi 提到基于本地文件夹的内容，它启动了 11 个专业 Agent 分 3 个阶段并行协作，模拟完整的企业咨询项目组，最终交付 12 份专业文档，覆盖 6 种格式。

针对每份文件，它还贴心地给出了使用场景快速导航，例如向 CEO/高管汇报用 07_管理层汇报.pptx + 12_数字化汇报.html，提交正式咨询报告使用 08_综合咨询报告.docx，投行/研究机构参考是 09_深度研究报告.pdf 等。

这件事放到我们打工人身上，只能是先看 A 公司，再看 B 公司；先开网页，再记笔记；先跑表格，再写结论。但 Kimi Work 这类本地 Agent 的加入，让知识工作正在从「一个人依次处理任务」变成「一个人调度一群 AI 处理任务」。

放心 Vibe Working

除了直接使用 300 个 Agent 的能力，配合 Agents 集群，我们还能利用之前 Kimi 内置专业金融数据源的独家亮点。不需要专门去找各种金融 Skill 或者配置数据 API，Kimi 会直接抓取到包括同花顺、天眼查以及世界银行经济数据库的金融数据。

这套数据配合 Agent 集群更能发挥它真正的实力。苹果 WWDC 马上要来了，我们要求 Kimi 帮我整理一下苹果这三年来的股价信息，以及每年的财报，分析其中值得的关注信息。

Kimi 一点都不含糊，同样是启用了 Subagent 工具，调用多个 Agents，完成了一份内容丰富的调研报告。

300 个 AI 和我的八块腹肌

除了网页，还有基于金融数据整理的 PPT、表格等内容，详细地概括了苹果的股价、主要收入、不同地区的收入情况等。

300 个 AI 和我的八块腹肌

对大多数的知识工作者来说，这套内置的专业金融数据源能帮助我们减少很多上手 Agent 的负担。

Kimi Work 另一项降低「交给 AI」门槛的功能是 WebBridge。根据官方的指引，我们也先让它使用浏览器搜索了 Kimi K2.6 的信息。

300 个 AI 和我的八块腹肌

Kimi 会自动启用一个标签组，所有自动化的操作都在该标签组内的网页上进行，调试过程中，Kimi 会自动输入对应的信息，自动截图查看当前页面状态，也会通过获取页面结构来定位搜索框、帖子内容等信息。

300 个 AI 和我的八块腹肌

对于 Google 这种无法搜索到小红书信息的搜索引擎，用 Kimi 来自动化整个搜索过程，并给出对应的总结，也是一种不错的用例。

使用 WebBridge 的方式也非常简单，按照官方的指引，我们在浏览器上安装好 Kimi WebBridge 的扩展程序，或是直接新建任务，要求 Kimi 帮我们完成安装，它会自动执行对应的安装脚本，在本地处理好 WebBridge 相关的服务。

300 个 AI 和我的八块腹肌

本地 Agent+Agent Swarm+WebBridge，这几项能力的综合，让 Kimi 能胜任的场景比单纯的聊天要广泛得多。

例如我们可以要它「检查我的 Gmail 邮箱，看看有没有过去 24 小时内未读的邮件。把重要的邮件总结一下。」然后，总结的内容全部保存到本地，甚至是把重要的邮件都保存下来。

Kimi 在浏览器中自动化操作了一会儿，就自动为我们生成了这份 Gmail 邮件总结报告。

300 个 AI 和我的八块腹肌

此外，结合我们之前要求它完成行业咨询任务，现在可以让它总结信息，自动撰写文件，选择合适的附件并发送邮件。

300 个 AI 和我的八块腹肌

或者针对那些从搜索引擎或者内置数据库中找不到的信息，先用 WebBridge 获取相关信息，再通过 Agent 集群来处理，形成各种报告文档。

AI 正在组队上工，学会做个甲方

这些检索内容、生成报告相关的能力，其实也正是前段时间 OpenAI 「知识工作者的下一个时代」报告里提到的，Codex 增长最快的知识型任务。统计的数据显示，数据分析任务，周环比增长 110%，而研究和知识产物也排名前三，有将近 37% 左右增长。

300 个 AI 和我的八块腹肌

Kimi Work 的出现很大程度上帮助知识工作者更好地处理这些任务，另一方面，知识工作者的核心竞争力开始与长时间内的信息处理速度高度绑定，Agent 集群的能力迎合了这一需求。

过去几年，大模型产品一直在寻找进入工作的方式。

聊天机器人负责回答问题，Copilot 开始参与工作，Coding Agent 学会执行任务。如今，随着文件访问、浏览器操作和工具调用能力逐渐成熟，Agent 开始承担越来越完整的工作流程。

更重要的变化在于，完成一项任务的主体，正在从单个 Agent 变成多个 Agent 的协作。

在 Kimi Work 的案例里，无论是研究 20 家 AI 公司，还是围绕本地文件生成一整套咨询报告，背后是一组 Agent 自动拆解任务、分工协作、交叉审核，再完成最终交付。

Anthropic 前几天在 AI 自我进化的报告中，就曾提到，现在的 Agent 已经从 Coding agents 的时代来到了 Autonomous agents 的阶段，核心的变化就是多 Agent 成为了一种新的工作组织方式。

300 个 AI 和我的八块腹肌

过去，知识工作的瓶颈往往来自人的时间和精力；未来，越来越多工作或许会变成另一种形式，人负责提出目标、判断方向和做最终决策，而资料搜集、信息整理、分析研究和文档交付，则由一支随时待命的 AI 团队协同完成。

打开电脑，面对的可能不再只是一个 AI 助手，而是一整个 Agent 团队。

One More Thing

当所有 AI 公司都在押注多 Agent 的产品形态时，四年一度的押注开始了。

美加墨世界杯即将在本周打响，48 支球队、104 场比赛。今年的竞猜选手，也有 AI 一席地。

Kimi 用 Agent Swarm 功能调动 300 个 Agent，对全部 104 场比赛进行赛前公开预测和赛后复盘，认为德国队被严重低估了，模型测算显示，德国队基准夺冠概率约11.0%，校准后约11.3%。

300 个 AI 和我的八块腹肌

今天 Kimi 发布的这份世界杯预测报告里面提到，连续两届世界杯小组出局的阴影，在公众和市场心理上留下了顽固的「近因偏差」，持续压低了德国的定价；但 Elo 排名、阵容估值和人才储备厚度的硬指标上，日耳曼战车依旧稳居世界第一梯队。

当然，德国队最后能不能夺冠，目前还不得而知。有意思的是，在这件事里，Kimi 想证明的可能从来不是自己会不会猜球。

为了分析预测，它调用 300 个 Agent 去搜集信息、拆解数据、评估概率，再持续复盘整个赛事过程。这套流程和前面那些行业研究、财报分析、咨询报告一样，世界杯预测只是另一种形式的复杂任务。

而当生活和工作中，越来越多的事情，我们都能安心交给这 300 个 AI 去完成时，那我的八块腹肌，或许真的还有点希望。

文章来自于"APPSO"，作者 "APPSO"。

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。

项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！

项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址：https://github.com/n8n-io/n8n

在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。

项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file

【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。

项目地址：https://github.com/Significant-Gravitas/AutoGPT

【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。

项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。

项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目

项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。

项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址：https://github.com/InternLM/MindSearch

在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。

项目地址：https://github.com/miurla/morphic/tree/main

在线使用：https://www.morphic.sh/