摘要
一种人工智能主体深度强化学习不确定性估计方法,主要包括以下步骤:将基于深度强化学习的决策不确定性分解为偶然不确定性和认知不确定性;基于贝叶斯和非贝叶斯方法,计算每个不确定度的基本分量;合成获得标准不确定度以及扩展。该方法突破了传统深度强化学习不确定性估计的建模方法,以贝叶斯和非贝叶斯的方式评估不确定度,能够有效减少人工智能主体深度强化学习探索‑利用所需的时间。
技术关键词
不确定性估计方法
深度强化学习算法
优化神经网络
样本
深度强化学习模型
灰色关联理论
损失函数设计
贝叶斯方法
训练神经网络
方差信息
加权方法
数据噪声
决策
建模方法
标签
系统为您推荐了相关专利信息
高斯混合隐马尔可夫模型
故障检测方法
样本
小波核函数
重构误差
风险预测模型
对象
强化学习模型
决策树模型
可读存储介质
计算机可执行指令
测量方法
测距设备
参数
电平转换电路
扬尘
多元线性回归模型
环境监测系统
数据变化趋势
检测器