SwarmFlow来了!openJiuwen开创蜂群可控协同新范式

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载

SwarmFlow来了!openJiuwen开创蜂群可控协同新范式
AI技术研报 2026-06-10 15:16
+9611 阅读

AI Agent 正在从 "单兵作战" 走向 "团队协作"—— 让多个 Agent 分工配合,去完成单个 Agent 难以独立扛下来的复杂任务,也是近期最受关注的方向之一。


沿着这条路,华为支持的openJiuwen 社区一直在围绕 Coordination Engineering(协同工程)推进多智能体协同:Agent Swarm 让多个智能体自主分工、协同执行;Swarm Skills 把一次成功的团队协作沉淀成可复用的 "团队技能";SwarmSkill Creator 进一步让用户用一句自然语言就能生成多角色团队。


能 "组起队" 之后,下一步要解决的,就是 "团队怎么稳定地把活干完"。


这一次,openJiuwen 给这条技术栈补上了新的一块 —— 开源 SwarmFlow,一种面向多智能体团队的可控工作流编排。


它想回答的,是多智能体走进复杂任务后绕不开的一个问题:


团队会协作了,但这套协作流程,能不能被稳定、可控、可复用地执行?


会协作之后:复杂任务带来的三个考验


要理解 SwarmFlow,得先理解它针对的痛点。


在主流的多 Agent 协作模式里,通常有一个 Leader Agent 充当大脑:它一边理解需求,一边拆任务、建成员、分配工作、等结果,再根据回传决定下一步。任务简单时,这种 "临场调度" 非常灵活。


但任务一旦变长、变大,出现多步骤、多分支,需要并行、需要验证和重试,把整条流程都压在 Leader 的临场判断上,会遇到三个绕不开的问题:


  • Leader 变成瓶颈 每一份中间结果都要回到 Leader,它的上下文很快被过程信息淹没,大量精力消耗在 "流程管理" 上,反而做不好真正需要它判断的事。
  • 过程不稳 同一个任务跑两次,可能走出两条不同路径 —— 因为每一步都取决于 Leader 当场怎么决定。
  • 执行不可靠。 谁先做、谁并行、什么时候汇总、失败怎么处理,这些要求即便提前写清楚,到底有没有被照做,仍然依赖 Leader 临场发挥。


而很多复杂任务的协作关系,其实是清晰、可以提前确定的。金融研判要让宏观、行业、风险、投资几个角色并行研判再统一汇总;论文分享要先读论文、再生成总结、最后撰写邮件发送 —— 每一步的输入输出都很明确。


openJiuwen 的判断是:这类任务真正关键的不是 "多叫几个 Agent",而是把这套确定的协作关系稳定地执行下来,而不是每次重新临场判断一遍。


核心思路:编排归系统,智能归 Agent


SwarmFlow 的解法,可以用一句话概括:把 "编排" 和 "智能" 分开。


谁先做、谁并行、谁把结果交给谁、什么时候汇总、失败如何处理 —— 这些协作关系(编排),交给系统按程序稳定执行;而每个子任务具体怎么理解、怎么推理(智能),才交给 Agent。


常见的多 Agent 协作流程是:Leader 既要做编排、又要做判断,两件事混在一起,全靠一轮轮临场推进。


SwarmFlow 做的,是把编排逻辑从 Leader 的 "临场理解" 里抽出来,变成一段系统可以自动执行的工作流:Leader 不再每一轮手动调度,只需要启动这条工作流,后续协作由 SwarmFlow 自动推进,Agent 只在需要推理的节点被调用。


由此,"团队怎么配合" 不再靠 Leader 临场判断,而是被系统稳定执行、自动追踪、可被复用。用 openJiuwen 自己的话说:SwarmFlow 增加的不是 Agent 数量,而是协作的确定性。


这背后是一个并不激进的判断:不是 "越自主越好",而是为任务匹配合适的形态。确定的编排更可预测、更易复盘,自主推理更灵活、更能应对开放问题。


那它和大家已经熟悉的 Swarm Skill 是什么关系?


一句话:Swarm Skill 是团队协作的能力包,SwarmFlow 是其中负责 "可执行编排" 的那部分能力。


SwarmFlow来了!openJiuwen开创蜂群可控协同新范式


Swarm Skill 定义了一支团队 —— 有哪些角色、各自负责什么、如何协作、遇到问题怎么处理。过去它更像一份 "团队协作说明书",把该怎么配合写清楚了,但真正执行时仍要靠 Leader 一边读、一边临场照做,流程一长,照样会回到上面那三个问题。


SwarmFlow 补上的正是 "执行" 这一环:当一支团队的协作流程可以提前确定时,就把这套编排写进 Swarm Skill 的 scripts/workflow.py,让它从 "靠 Agent 临场照做" 变成 "被系统直接执行"。


所以 SwarmFlow 不是另起炉灶的新概念,而是让 Swarm Skill 从一份 "协作说明书",长出一条 "可执行的工作流"。


该不该写成脚本:就看编排能不能提前确定


SwarmFlow 比较有意思的地方,在于它没有走 "把一切都脚本化" 的极端。openJiuwen 给出的判断标准只有一个 ——编排能不能提前确定。 


同一个 Swarm Skill 由此分成两种形态。


SwarmFlow来了!openJiuwen开创蜂群可控协同新范式


第一种,不带 workflow.py 脚本。 适合编排本身就动态的场景,比如多专家圆桌研讨、方案评审、战略讨论。这类任务里,角色和阶段是确定的 —— 会有哪些人参与、大致经历 "独立思考、相互讨论、观点汇总" 几个阶段;但谁回应谁、谁质疑谁、谁补充谁,需要根据上下文临场决定。它更像一场真实会议:议程是确定的,但观点如何流动、信息如何交锋,得在协作过程中自然发生。强行写成脚本,反而会束缚协作。所以这类 Swarm Skill 只沉淀角色、规则、边界和协作方式,把 "谁交给谁" 留给临场判断。


第二种,带 workflow.py 脚本。 适合编排可以提前确定的任务,比如论文分析与办公自动化:论文解析的结果交给总结,总结交给文档生成,文档再交给邮件撰写 —— 谁接谁、下一步做什么,都能提前定好。于是脚本里用 SwarmFlow 把这套编排固化下来,交给系统稳定执行。


一句话:编排是动态的,用不带脚本的 Swarm Skill 保留开放协作;编排能提前确定,用带脚本的 Swarm Skill 承接可执行编排。


这正是 SwarmFlow 的设计亮点 —— 确定性与开放性可以在同一套体系里各得其所,十分灵活。


SwarmFlow 长什么样:用积木搭出团队工作流


openJiuwen 提供了一组算子当积木,用于搭建 SwarmFlow—— 每个算子只管一件事,拼起来就能描述出复杂的团队协作。


SwarmFlow来了!openJiuwen开创蜂群可控协同新范式


这套积木大致覆盖四类需求:派生智能体去执行子任务、让多个智能体以不同方式并发与流转、把长流程切分成可观察的阶段并支持子流程复用、以及在关键环节插入人机交互。


落到具体能力上,有几处设计值得一提。


并发不止一种:一种是并行 parallel,几个智能体一起跑、全部完成后统一汇总;另一种是流水线 pipeline,多个条目各自独立逐级流过、互不等待 —— 前者适合多视角研判后合并,后者适合批量逐条处理。有状态的智能体 agents_session 能在多轮协作中保留记忆,甚至 "分身" 出一个副本去做假设推演而不污染主线。需要人拍板的地方,可以插入一个人机节点 human,在执行中向人类要一条输入或一次审批。此外还有专门约束资源与额度消耗的算子 budget,把 "会不会跑超" 也纳入了可控范围。


通过这些算子:一个动作一块积木,复杂协作由简单积木拼出来,无需从零设计编排逻辑。


同时,SwarmFlow 不是黑盒,在 JiuwenSwarm TUI 中,用户还可以通过 /swarmflows 打开内置可视化视图,用一张实时交互式树状图查看当前会话里的所有 Swarm Workflow:上方展示阶段进度,下方联动展示选中阶段里的 Agent 状态;需要进一步排查时,也可以下钻到单个 Agent,查看提示词、输出结果或错误日志。


SwarmFlow来了!openJiuwen开创蜂群可控协同新范式


对想把多智能体用进生产的团队来说,可观测、可续跑、可控额度,往往比 "算子多不多" 更要紧。


怎么用:从一句话生成,到 Team 模式自动调用


形态分成两种,门槛却没有变高,因为生成和调用都被 openJiuwen 包了起来。


SwarmFlow来了!openJiuwen开创蜂群可控协同新范式


生成端,交给内置的 SwarmSkill Creator。 它是 JiuwenSwarm 内置的能力,用户无需额外安装,会根据自然语言需求自动判断该生成哪种形态:默认生成不带脚本的 Swarm Skill(角色、协作规则、流程说明和约束),适合开放协作;当它判断用户要的是一条工作流 —— 比如 "帮我写一条工作流,逐篇分析这批论文、汇总成报告再发邮件"—— 就生成仅含脚本的版本,只保留一个最小的 Skill.md 入口和一个 workflow.py,让用户快速拿到能跑、可复用的工作流;两者都要时,也支持生成兼具完整协作规范和脚本的版本。用户不必先理解文件结构,也不必手写编排脚本,只要把目标说清楚。


调用端,在 Team 模式下一句需求自动进入。 用户不用分辨任务属于哪种形态,也不用手动编排每个 Agent 的执行顺序,只要用自然语言描述,系统会判断其中是否包含工作流意图。


例如 "用工作流帮我分析这家公司是否值得投资",或 "用 swarmflow 组织几个专家阅读这篇论文、生成总结文档并起草一封邮件"。识别到工作流意图后,系统会进一步判断任务形态:适合固定编排就进入 SwarmFlow,更适合开放协作就用不带脚本的 Swarm Skill,单个 Agent 够用就不额外启动多 Agent。


这也是 openJiuwen 想定义的可控协同工程新范式 —— 让复杂协作在系统内部变得可控,让用户侧保持自然和简单。


三个实战场景


看完了设计,再看看实战效果。


参考 JiuwenSwarm 快速上手,先安装与启动 JiuwenSwarm:https://openjiuwen.com/jiuwenswarm#quick-start


场景一:从一张流程图,生成一套金融分析的 SwarmFlow。用户上传了一个流程图,JiuwenSwarm 基于该流程图,使用内置的 swarmskill-creator 即可直接生成该流程图对应的 SwarmFlow 团队技能,包含对应的工作流执行脚本 —— 整条 SwarmFlow 不用手动编排,由一张图直接生成。


用户提出分析目标,这条工作流就会自动启动:先进行数据采集、清洗,然后从财务、行情等五个维度并行分析,最后交叉验证、综合置信度,输出完整的分析报告和总结建议。整个过程中,用户看到的不只是最终答案,还能看到团队在各阶段如何推进。


SwarmFlow来了!openJiuwen开创蜂群可控协同新范式


场景二:给定选题,自动进行技术调研、素材整理并发送邮件。这个案例是一个更接近日常办公和科研协作的技术分享工作流。用户只需要给出技术分享主题和目标读者,SwarmFlow 就会自动组织多个阶段依次推进:先搜索相关论文和资料,再整理素材、提取可用图片并保存到本地目录;随后分析核心问题、技术趋势、关键观点、可讨论议题等;最后生成结构清晰、适合组内阅读的技术分享邮件,并发送给指定收件人。


技术分享是一类会反复发生的团队工作:主题会变,但 “搜资料、提素材、做分析、写邮件、发出去” 的动作和标准相对稳定。SwarmFlow 可以把这套流程固化下来,避免每次临场指挥导致步骤遗漏、口径变化和交付不一致。


SwarmFlow来了!openJiuwen开创蜂群可控协同新范式


场景三:在已有团队技能上补充工作流,200 页 PPT 稳定产出。这个案例基于已有的团队技能,生成了一条专门生产 PPT 的工作流 —— 设计三阶段流程,阶段一首先规划章节主题和分工,阶段二里 10 个章节并行生成 PPT,最后合并阶段把所有章节统一汇总,整理成一份 200 页的完整 PPT。


做大型 PPT 正是那种 "步骤固定、但量大易乱" 的任务:两百页内容若全靠 Leader 一页页临场调度,每次跑出来的结构、风格、详略都可能不一样;而固化成工作流之后,每次都按相同的步骤和标准执行,既靠并行明显加速,又能稳定产出一份结构统一、风格一致的 200 页 PPT。




几点观察与思考


把这次开源放回 openJiuwen 的 Coordination Engineering 这条线上看,SwarmFlow 几个设计上的选择值得关注。


一是它把 "编排" 和 "智能" 显式切开,又和 Swarm Skill 这套能力包统一了起来 ——"可执行编排" 成了团队能力的一部分,而不是另起一套独立的编排系统。


二是它用自然语言生成(SwarmSkill Creator)加 Team 模式自动路由,"该用哪种形态" 不需要用户操心。


三是人机节点、可观测、断点续跑、额度约束这层工程能力,保证了 "可控" 真正落地。


值得一提的是,华为云 AgentArts 也已经将 openJiuwen 引入到商业化平台能力中,开箱即用,感兴趣的用户可以直接去华为云官网体验。


多智能体的故事,正在从 "能不能协作",走向 "能不能稳定地把复杂工作干完"—— 而后者更难、也更关键。SwarmFlow 给出的答案是把 "编排" 交给系统、"智能" 留给 Agent:它增加的不是 Agent 数量,而是协作的确定性。作为国产全开源的 AI Agent 平台,openJiuwen 也已将 SwarmFlow 完整放在社区上,值得开发者上手试试,也值得我们持续关注。


文章来自于"机器之心",作者 "机器之心"。

1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案