一种用于离线强化学习的模型融合方法

AITNT
正文
推荐专利
一种用于离线强化学习的模型融合方法
申请号:CN202511276449
申请日期:2025-09-08
公开号:CN120763876A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了一种用于离线强化学习的模型融合方法,包括:获取初始模型集合;对所述初始模型集合中每个模型的操作原始变量进行张量典型相关性分析,生成变换矩阵;将所述初始模型集合中的其中一个模型作为基准模型,并通过所述变换矩阵将除所述基准模型之外的其他所有模型的操作原始变量映射至低维度子空间,再回映射至所述基准模型的空间,生成中间模型集合;对所述中间模型集合中每个模型的操作原始变量进行融合,生成融合后的操作原始变量;根据融合后的操作原始变量,生成最终融合模型。本发明提出的用于离线强化学习的模型融合方法,性能更优异,表现更鲁棒,可以解决现有模型对于机器人控制的训练抖动大,同一任务多个模型方差大等问题。
技术关键词
模型融合方法 典型相关性分析 离线 基准 参数 变量 协方差矩阵 机器人控制 可读存储介质 注意力机制 决策 计算机 复杂度 序列 处理器
系统为您推荐了相关专利信息
1
一种姿态增强的多目标跟踪方法及系统
特征值 轨迹 跟踪方法 跟踪系统 匈牙利算法
2
一种应用于配电网规划中的空调需求响应潜力评估方法
空调需求响应 潜力评估方法 PMV模型 等效热阻 配电网规划技术
3
一种超压低渗储层的动态渗透率测井计算方法
测井计算方法 电缆地层测试 动态 微观孔隙结构 饱和度
4
基于变点检测的水下微弱目标信号检测与方位跟踪方法与系统
水听器阵列 短时傅里叶变换 决策 变量 方位跟踪方法
5
一种基于改进遗传算法的柔性作业车间调度方法及系统
柔性作业车间调度 遗传算法设计 数据输入模块 双工位机床 设备协同工作
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号