一种基于专家知识-决策数据融合的无人系统策略虚实增强方法

正文

推荐专利

申请号：CN202411895395

申请日期：2024-12-21

公开号：CN119692386A

公开日期：2025-03-25

类型：发明专利

摘要

本发明一种基于专家知识‑决策数据融合的无人系统策略虚实增强方法，属于无人系统智能决策领域。本发明包括：通过现实环境人机交互和虚拟环境自主推演的方式获取专家、无人系统智能体决策轨迹；融合专家轨迹和无人系统智能体轨迹数据形成混合决策轨迹；基于任务场景的奖励规则补全混合决策轨迹奖励信息；将完整混合决策轨迹和无人系统智能体轨迹数据保存到经验池；从经验池获取轨迹训练数据，计算虚实混合权重；利用虚实混合权重计算无人系统智能体策略网络的损失，训练无人系统智能体策略网络，以用于真实场景中无人系统的轨迹决策。本发明提高了无人系统智能体的决策效率，解决了虚拟场景中训练的决策模型迁移到真实场景中难以直接适用的问题。

技术关键词

三元组序列策略融合专家决策网络模型数据智能体模型人机交互方式场景生成轨迹超参数定义标记

系统为您推荐了相关专利信息

一种基于动态多维建模的项目成本智能管控方法及系统

项目编码向量数据编码智能管控方法风险

一种GPU算力的智能动态管理方法及云平台

动态管理方法资源分配策略硬件状态监控 GPU互联结构管理云平台

一种用于山塘小水库渔业捕捞的鱼类智能识别方法及系统

智能识别方法水库特征提取单元彩色图像多策略融合

基于视频的数字人动作迁移方法、装置、设备及存储介质

姿态估计迁移方法视频融合特征人体关键点

基于深度学习的生物医学图像精准检测处理系统及方法

多尺度特征金字塔生物医学知识库图像融合策略度量

一种基于专家知识-决策数据融合的无人系统策略虚实增强方法

站点导航

APP 下载