通用生物医学Agent，可由「任务」自主生成「工作流」，斯坦福、基因泰克等开发Biomni

AI技术研报 2025-06-26 10:48

+7888 阅读

生物医学研究是我们进行人类健康研究、疾病治疗、药物研发以及促进临床护理进步的基石。

然而，随着复杂的湿实验、庞杂的数据集、众多分析工具以及海量文献的增长，生物医学研究日益受到重复性和碎片化工作流程的制约。这些工作流程使研究发现的速度严重变慢，且限制了创新的发生。

因此，我们亟需一种全新的方法来扩展专业科学知识。

斯坦福大学（ Stanford University）、基因泰克（genentech）、普林斯顿大学（Princeton University）等组成的联合研究团队开发了 Biomni，这是一款通用的生物医学 AI 智能体（Agent），它可以自主执行涵盖各个生物医学子领域的广泛研究任务。

小编觉得它可能很靠谱！为什么这样说呢？大家简单看下它的工作逻辑就明白了。

通用生物医学Agent，可由「任务」自主生成「工作流」，斯坦福、基因泰克等开发Biomni

为了系统地绘制生物医学行动空间，Biomni 首先使用一个行动发现智能体来创建第一个统一的智能体环境——从 25 个生物医学领域的数万篇出版物中挖掘必要的工具、数据库和协议。

在此基础上，Biomni 具有通用智能体架构，将大型语言模型 (LLM) 推理与检索增强规划和基于代码的执行相结合，使其能够动态地组合和执行复杂的生物医学工作流程——完全不依赖预定义的模板或严苛死板的任务流。

系统基准测试表明，Biomni 在异构生物医学任务（包括因果基因优先级排序、药物再利用、罕见疾病诊断、微生物组分析和分子克隆）中实现了强大的泛化，无需任何特定于任务的快速调整。

Biomni 拥有在真实案例中解读复杂多模态生物医学数据集并自主生成可实验测试方案的能力。它的出现使我们可以畅想，未来虚拟 AI 生物学家与人类科学家并肩作战，将显著提升研究效率、临床洞察力和医疗保健水平。

该研究以「Biomni: A General-Purpose Biomedical AI Agent」为题，于 2025 年 5 月 30 日发布在 BioRxiv 预印平台。

通用生物医学Agent，可由「任务」自主生成「工作流」，斯坦福、基因泰克等开发Biomni

论文链接：https://www.biorxiv.org/content/10.1101/2025.05.30.656746v1.full

Biomni 架构

Biomni 由两个主要组件组成：Biomni-E1（一个具有统一动作空间的基础生物医学环境）和 Biomni-A1（旨在有效利用该环境的智能体）。

通用生物医学Agent，可由「任务」自主生成「工作流」，斯坦福、基因泰克等开发Biomni

图示：Biomni 中统一的生物医学行动空间和智能体环境概述。（来源：论文）

整理一个统一的生物医学行动空间极具挑战性，因为它本身就非常复杂且内容庞大。研究人员采用人工智能驱动的方法系统地解决了这个问题。

具体来说，他们利用 bioRxiv 定义的 25 种学科类别，并在每个类别中选取 100 篇最新文章。行动发现 LLM 智能体按顺序处理每篇论文，提取复制或生成所述研究所需的基本任务、工具、数据库和软件。这套全面的资源构成了执行大量生物学研究任务所需的基本行动。

关于 Biomni-E1

随后创建了 Biomni-E1，这是一个供生物医学 AI 智能体执行各种操作的环境。已确定的工具均由人类专家进行严格验证，并附有相应的测试用例。这些工具因其重要性而被特意挑选出来，涵盖复杂的代码、特定领域的专业知识或专门的 AI 模型。

鉴于生物软件本身所需的灵活性，其本身无法简化为静态函数，研究人员构建了一个预装了 105 种常用生物软件包的执行环境，支持 Python、R 和 Bash 脚本。

为了方便数据库集成，他们将资源分为两类。

第一组由可通过 Web API 访问的海量关系数据库（例如 PDB、OpenTarget、ClinVar）组成。他们没有创建多个单独的检索工具，而是为每个数据库实现了一个统一的函数。每个函数接受自然语言查询，并在内部使用 LLM 解析数据库模式并动态生成可执行查询。

第二组是将不具备 Web 界面的数据库下载到数据湖中，并在本地预处理为结构化的 Pandas DataFrame，以便与智能体无缝集成。

该团队提出的 Biomni-E1 是首个生物医学 AI 智能体环境，含 150 个专用生物医学工具、105 个软件和 59 个数据库。

关于 Biomni-A1

为了构建一个能够处理各种生物医学任务的通用智能体，研究人员需要一个专门的智能体架构——避免为每个任务编写硬编码的工作流程。这促成了 Biomni-A1 的开发，它融合了多项对整个生物医学研究领域至关重要的核心技术。

首先，研究人员引入了一种基于 LLM 的工具选择机制，旨在应对生物医学工具的复杂性和专业性，并根据用户目标动态检索定制的资源子集。

其次，考虑到生物医学任务通常需要丰富的程序逻辑，Biomni-A1 使用代码作为通用操作接口，使其能够编写和执行涉及循环、并行化和条件逻辑的复杂工作流。至关重要的是，这种方法还使智能体能够交错调用不符合预定义函数签名的软件、工具、数据库和原始数据操作，从而支持异构资源的灵活和动态集成。

第三，该智能体采用自适应规划策略：它基于生物医学知识制定初始计划，并在执行过程中不断迭代完善，从而实现响应迅速、情境感知的行为。

这些技术共同使 Biomni-A1 能够泛化到前所未有的任务和领域，动态地组合智能动作，并与软件、数据和工具进行交互，从而体现出通用生物医学智能。

基准测试

通用生物医学Agent，可由「任务」自主生成「工作流」，斯坦福、基因泰克等开发Biomni

图示：Biomni 在各种现实生物医学任务中的零样本泛化。（来源：论文）

基准测试表明，Biomni 在现有的生物医学问答基准测试中表现出色，并在八个开发过程中从未遇到过的具有挑战性的现实场景中表现出强大的泛化性能。

研究人员通过三个具有影响力的案例研究来强调 Biomni 的实践能力：

分析 458 个可穿戴传感器数据文件从而产生新的见解；
对大量原始数据集（例如单细胞 RNA-seq 和 ATAC-seq 数据）快速进行全面的生物信息学分析，以产生新的见解和假设；
自主设计实验室协议从而协助湿实验室研究人员完成任务。

通用生物医学Agent，可由「任务」自主生成「工作流」，斯坦福、基因泰克等开发Biomni

图示：Biomni 设计湿实验室实验方案。（来源：论文）

意义深远

Biomni 在遗传学、基因组学、微生物学、免疫学、药理学和临床医学等复杂任务中的零样本性能，展现了其在提升科研效率、加速发现和拓展高级生物医学分析应用方面的潜力。

它通过将复杂且劳动密集型的工作流程（通常需要专业知识和编程技能）自动化，使研究人员能够将精力转向创造性假设的生成、实验创新和跨学科合作。

通用生物医学Agent，可由「任务」自主生成「工作流」，斯坦福、基因泰克等开发Biomni

图示：Biomni 自主执行复杂的多模式生物医学分析并生成假设。（来源：论文）

这一转变具有重要意义，比如：

在生物制药的靶点和药物研发领域，Biomni 可以自主确定靶点优先级、设计干扰筛选或重新利用药物，从而为更快速、更具成本效益的研究提供途径。
在临床应用领域，其在基因优先级排序和罕见病诊断方面的能力，有助于提供更精准、个性化的洞察，并简化诊断流程。
对于消费者健康而言，Biomni 将可穿戴数据与多组学分析相结合，实现实时、个性化的健康监测和干预。

局限性

同时，研究人员也分析了 Biomni 的局限性。Biomni 的统一环境覆盖了大量生物医学工具和数据库，但评估任务仅涉及该领域一小部分，且许多关键领域仍未探索。

虽然其在数据库查询、序列分析等任务上接近人类水平，但在需要深度临床判断或创新实验推理的任务中仍存在局限，尚未达到全领域专家级性能。

展望未来

尽管如此，这些局限性为未来的发展开辟了新的方向。利用强化学习训练生物医学推理智能体，可以使其在规划和执行方面不断自我提升。

整合多模态数据（文本、图像和结构化输入）可以进一步深化推理能力。让 Biomni 能够自主发现和整合新的工具和数据库，并整合更多历史方法（曾经出现过的具有很高实用性的方法），将确保其适应性和长期相关性。

展望未来，Biomni 及其后续产品有望成为人工智能驱动的生物医学生态系统的基础设施，与人类专家无缝协作，解锁关于健康和疾病的全新见解。

这种混合型合作关系或将彻底重塑生物医学研究——自动化假设生成，扩展发现流程，并使医学创新以前所未有的速度和规模推进。像 Biomni 这样的通用药物不仅可以加速突破，还能重新定义科学探究的未来。

Biomni 已经上线，供大家免费使用，快去体验一下吧👇。

Biomni：https://biomni.stanford.edu

文章来自于“ScienceAl”，作者“萝卜皮”。

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。

项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！

项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址：https://github.com/n8n-io/n8n

在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。

项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file

【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用：https://vectorvein.ai/（付费）

AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址：https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装：https://www.deepbi.com/

【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体，能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址：https://github.com/hitsz-ids/airda

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。

项目地址：https://github.com/Significant-Gravitas/AutoGPT

【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md