摘要
本发明公开了基于轨迹分支生成的序列建模数据增强方法及系统,属于深度强化学习技术领域。包括以下步骤:在机器人的轨迹数据集中采样轨迹片段;对轨迹片段使用轨迹价值函数生成预测轨迹片段的未来回报;将轨迹片段与轨迹片段的未来回报作为组合条件,通过扩散模型生成轨迹分支;将轨迹分支与轨迹片段和轨迹片段的未来回报连接,得到扩展轨迹;将扩展轨迹通过分支过滤器进行过滤,得到轨迹分支。
技术关键词
分支
机器人
生成轨迹
数据
序列
深度强化学习技术
过滤器
可读存储介质
索引
处理器
采样模块
超参数
存储器
计算机
连续性
电子设备
离线
场景