当前基于大语言模型(LLM)的智能体构建通过推动自主科学研究推动 AI4S 迅猛发展,催生一系列科研智能体的构建与应用。然而人工智能与自然科学研究之间认知论与方法论的偏差,对科研智能体系统的设计、训练以及验证产生着较大阻碍。
与传统综述不同,本篇综述为大家呈现了科研智能体的「漫游指南」,旨在提供构建科研智能体的「说明指南」:从科学研究的全周期出发,概述了科研智能体的分级策略,并详细阐述了对应等级的构建策略与能力边界;同时该「漫游指南」详细阐明了如何从头构建科研智能体,以及如何对科研智能体的定向能力进行增强。同时「指南」中详细涵盖了科研智能体的概念阐述、构建方案、基线评估以及未来方向。
希望本「漫游指南」能启发 AI 研究者与具体自然科学研究者,促进 AI 与自然科学之间的深度融合。
综述的核心贡献如下:
图 1|科研智能体对于科研过程全生命周期的介入
图 2|科研智能体分级示意
根据构建策略与其能力边界的等级划分,科研智能体被我们分为三个等级:
图 3|不同等级科研智能体汇总
本综述凝练了科研智能体的构建过程,从头构建科研智能体的工作流主要为知识组织、知识注入以及工具集成三个部分构成。
知识组织:知识组织定义了科学信息如何被结构化,以便使智能体能够有效地理解和推理。它涵盖非结构化序列(例如研究论文和书籍)、结构化数据(例如基因表达数据集)、指令(例如问答对)以及知识图谱,每种方式都提供了独特的方式来表示和检索领域知识。这些组织策略作为智能体推理、归纳和决策的基础,对于科学发现至关重要。
知识注入:知识注入涉及将特定领域的专业知识嵌入科学智能体中,这可以通过显式或隐式方法实现。显式注入直接将知识整合到提示中或针对特定任务优化提示,而隐式注入通常涉及微调模型或使用强化学习来使智能体的响应适应特定领域。这两种方法都旨在通过注入相关专业知识来增强智能体解决特定领域科学挑战的能力。
工具集成:工具集成通过将外部工具用于专业任务(如专业知识获取、执行和模拟、分析以及可视化)来扩展智能体的功能。通过选择和集成特定领域的工具,科研智能体可以更高效地执行复杂任务。这些工具的有效集成使科研智能体能够自主运行,协调各种资源以协助科学研究与发现。
根据现有基准的侧重不同,基准主要分为知识密集型任务以及实验驱动型任务,两者对于整体科学研究过程中各有侧重。
知识密集型:科研智能体主要设计用于处理需要深厚专业知识的复杂、特定领域的任务。这些任务通常围绕知识传播展开,包括文献挖掘、研究假设生成、实验设计、结果分析和评估。这类任务要求智能体在专业领域具备认知能力,而非简单的一般知识。
实验驱动型:面向科研智能体的实验驱动任务评估代理在科学探究中使用工具的能力,强调自主实验设计、验证以及在科学环境中的多过程探索。
图 4|基准测试汇总
在此,我们诚挚邀请 SCI 领域的同学和教师与我们联系与合作,共同推动科学代理在自主科学研究中的应用与发展。我们相信,通过多学科的跨界合作和经验交流,能够为科学研究的创新和效率提升提供强有力的支持。
如果您对我们的工作或研究方向感兴趣,欢迎随时与我们建立联系。期待与各界科研人员携手合作,共同探索科技前沿,实现更广泛的学术价值和应用潜力。
联系方式:
中国科学院自动化研究所 & 北京中关村学院 2024 级直博生王新茗
wangxinming2024@ia.ac.cn
中国科学院自动化研究所副研究员 & 北京中关村学院共建导师徐健
jian.xu@ia.ac.cn
文章来自于微信公众号“机器之心”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner