摘要
人工智能和机器人学习技术领域的一种基于情节记忆的机器人训练系统和方法,解决现有机器人训练方法缺乏有效记忆调度体系、经验价值量化机制不智能、多模态信息融合能力不足等问题。系统包括感知模块、多模态统一记忆编码器、递进式记忆调度体系、多维价值量化评判机制、智能化经验分层调度器、多模态统一编码检索器、策略生成模块、执行模块和异常检测模块。多模态统一记忆编码器采用分层降维的Transformer架构,将RGB图像、深度图像、力觉传感器数据和关节角度信息融合为576维统一特征向量;递进式记忆调度体系包括工作记忆、短期记忆和长期记忆三层结构;多维价值量化评判机制基于奖励评估、新颖性评估和不确定性评估对经验进行量化评分。
技术关键词
机器人训练系统
机器人训练方法
记忆单元
注意力机制
关节角度信息融合
环境状态信息
重构误差
机器人学习技术
动作策略
编码器
分层
多模态信息融合
梯度算法
加权融合算法
指数衰减函数
力觉传感器