摘要
本发明公开了一种基于后验和多样性协同任务采样的自适应决策方法,本发明的方法包括在每次决策模型的训练中从机器人控制任务分布中采样得到候选训练任务,对于筛选出的每个训练任务利用当前采样策略采样生成训练数据,并利用训练数据对决策模型的参数进行更新;将训练数据输入至任务风险预测模型中以基于编码器‑解码器架构计算近似证据下界ELBO损失,并根据计算得到的ELBO损失函数更新任务风险预测模型的参数;将测试数据输入至更新后的决策模型,并基于更新后的任务风险预测模型反馈的任务风险评估结果优化决策信息,以输出机器人控制任务最终的任务决策结果。本发明在机器人控制的复杂应用场景中,能够有效提升系统的整体性能和适应性。
技术关键词
风险预测模型
机器人控制
贝叶斯准则
生成训练数据
解码器架构
标识符
解码器模型
决策方法
策略
编码器
决策系统
参数
模型训练模块
变量
提升系统
输出模块
动态
系统为您推荐了相关专利信息
动作模块
助理机器人
交互动作
物体
路径规划单元
管道巡检机器人
爬行机构
机身主体
机器人控制方法
滑轨固定架
机器人抓取方法
移动物体
机器人控制算法
缓存机制
控制策略
运动学特征
风险预测模型
融合特征
风险预测方法
道路标志标线