摘要
本申请公开了一种机器人行为学习的目标驱动方法及系统,涉及行为学习、人工智能技术,包括:获取Play数据,并基于目标状态扩展所获取的Play数据,其中任一Play数据包含成对元组(οt,αt),οt表示t时刻的观察,αt表示t时刻的动作;基于扩展的Play数据,利用目标驱动变压器(Goal‑Driven Transformer GDT)模型输出用于目标驱动的动作概率分布,其中GDT模型包括嵌入层、目标驱动注意模块和标准注意模块。本申请提出了一种目标驱动的注意机制,显著提高了机器人识别和执行复杂动作序列以达到预期未来或目标状态的能力。
技术关键词
驱动方法
机器人
驱动变压器
模块
数据
序列
人工智能技术
编码器
注意力机制
三元组
存储器
解码器
处理器
线性
聚类
标记
代表
算法
系统为您推荐了相关专利信息
多层窗结构
参数优化方法
动态仿真模型
设备运行参数
建筑围护结构
智能巡检方法
高斯概率密度函数
分布式在线监测系统
节点
管廊