一种基于后验和多样性协同任务采样的自适应决策方法

正文

推荐专利

申请号：CN202510289738

申请日期：2025-03-12

公开号：CN120258079A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了一种基于后验和多样性协同任务采样的自适应决策方法，本发明的方法包括在每次决策模型的训练中从机器人控制任务分布中采样得到候选训练任务，对于筛选出的每个训练任务利用当前采样策略采样生成训练数据，并利用训练数据对决策模型的参数进行更新；将训练数据输入至任务风险预测模型中以基于编码器‑解码器架构计算近似证据下界ELBO损失，并根据计算得到的ELBO损失函数更新任务风险预测模型的参数；将测试数据输入至更新后的决策模型，并基于更新后的任务风险预测模型反馈的任务风险评估结果优化决策信息，以输出机器人控制任务最终的任务决策结果。本发明在机器人控制的复杂应用场景中，能够有效提升系统的整体性能和适应性。

技术关键词

风险预测模型机器人控制贝叶斯准则生成训练数据解码器架构标识符解码器模型决策方法策略编码器决策系统参数模型训练模块变量提升系统输出模块动态

系统为您推荐了相关专利信息

一种数据特征分析的医疗问答模型蒸馏构建方法

问答模型蒸馏分支基础生成训练数据

一种基于多模态大模型的家务助理机器人

动作模块助理机器人交互动作物体路径规划单元

一种管道巡检机器人及机器人控制方法

管道巡检机器人爬行机构机身主体机器人控制方法滑轨固定架

基于深度强化学习的机器人抓取方法及系统

机器人抓取方法移动物体机器人控制算法缓存机制控制策略

一种基于交互信息融合网络的车辆行驶风险预测方法

运动学特征风险预测模型融合特征风险预测方法道路标志标线

一种基于后验和多样性协同任务采样的自适应决策方法

站点导航

APP 下载