摘要
本申请提出了一种异构场景下复杂技能主动学习、增强与虚实迁移方法,该方法包括:首先通过多执行器环境互动收集状态数据,存入共享经验池,采样后交替训练执行器与判别器,最终选定最优执行器部署,实现复杂技能主动学习与增强;然后在3C装配的数字孪生环境下,通过采集多模态数据构建技能知识库,生成策略序列,运用残差强化学习等技术优化,通过编码解码模型实现技能策略从虚拟到现实的迁移。基于本申请提出的方案,没有教师模型或示教数据的情况下,通过结合强化学习和知识蒸馏技术,提高了技能学习的效率,为解决复杂环境下的技能学习问题提供了一种新的视角和方法,并实现了操作技能从仿真环境到真实装配环境的虚实迁移。
技术关键词
示教数据
数字孪生
多模态
策略
迁移方法
解码器模型
训练样本数据
虚拟现实VR设备
场景
知识蒸馏技术
异构
控制执行器
编码器
接触特征
序列
解码模型
特征提取器
操作技能
系统为您推荐了相关专利信息
广告主
自然语言解析
服务器
机器学习模型
广告投放优化方法
扫描数据修正方法
三维模型信息
牙齿模型
锥形束计算机断层扫描
最小化误差
人类驾驶员
决策
环境感知信息
生成对抗网络
轨迹
数字孪生系统
数字孪生模型
字典
模块
数据获取单元