一种大模型辅助的智能体训练方法及系统

正文

推荐专利

一种大模型辅助的智能体训练方法及系统

申请号：CN202510327404

申请日期：2025-03-19

公开号：CN120297356A

公开日期：2025-07-11

类型：发明专利

摘要

本发明涉及人工智能技术领域，具体涉及一种大模型辅助的智能体训练方法及系统，包括初始化智能体策略参数、环境和多模态大模型；启动训练，将多模态大模型介入对智能体行为进行评价，获得环境经验和大模型经验；更新智能体策略参数，待智能体策略水平不再提升时，结束训练，利用大模型在大规模数据集上训练后所获得的先验知识和语义理解能力，对智能体的高层次抽象任务目标进行分析并根据智能体行为给予奖励。将环境描述、任务目标作为提示词输入大模型建立环境与任务认知，推理智能体采取的动作是否合理并输出当前动作的奖励，将大模型与环境输出的奖励合并返回智能体帮助其更新自身策略，能够在一些环境下提升智能体策略性能。

技术关键词

智能体训练方法多模态深度神经网络参数人工智能技术策略更新训练系统模块高层次语义数据

系统为您推荐了相关专利信息

一种基于YOLO算法的轻量化检测方法

YOLO算法网络结构注意力卷积模块归一化方法

显示亮度补偿方法、装置、显示装置和存储介质

显示亮度补偿方法灰阶补偿值画面电压补偿

一种基于人工智能的中药组方生成系统

生成系统构建机器学习模型中药草药特征提取模块

一种基于多重约束的小区域碳汇计算方法及系统

无人机激光雷达数字高程模型叶面积指数分水岭算法滤波技术

机器人标定方法、装置、电子设备及存储介质

对接误差雅可比矩阵机器人标定方法双机器人基座坐标系

一种大模型辅助的智能体训练方法及系统

站点导航

APP 下载