基于扩展卡尔曼滤波和强化学习的束线站参数优化方法

正文

推荐专利

申请号：CN202510053213

申请日期：2025-01-14

公开号：CN119474620B

公开日期：2025-05-16

类型：发明专利

摘要

本申请涉及强化学习技术领域，尤其涉及一种基于扩展卡尔曼滤波和强化学习的束线站参数优化方法，包括基于初始策略和预设的目标状态从环境中随机选择初始状态并进行采样，收集多条由连续经验四元组组成的轨迹数据；在第一轮采样使用收集到的轨迹数据训练概率神经网络得到状态转移模型；对于每条轨迹数据结合状态转移模型开展扩展卡尔曼滤波，使用滤波后的下一时刻状态替换进每条轨迹数据的经验四元组中并保存进经验回放池；使用DDPG算法从经验回放池中随机采样经验四元组并对策略进行学习更新获得新的策略，依此循环直至策略学习完成。本申请能够缓解系统误差带来的影响，提高状态估计的准确性，从而使得策略的学习更为精准。

技术关键词

状态转移模型扩展卡尔曼滤波参数优化方法协方差矩阵轨迹策略参数优化系统强化学习技术数据采集模块系统误差程序处理器代表算法阶段可读存储介质存储器

系统为您推荐了相关专利信息

一种基于6D位姿估计的透明物体抓取方法及系统

物体抓取方法视觉感知设备五次多项式插值粒子群优化算法图片

一种兼顾内外场的机动式节点补盲优化部署方法

优化部署方法无线传感器网络 TDOA测量误差无线传感器节点协方差矩阵

风场机组对比式故障诊断方法、系统、设备及存储介质

综合健康指数故障诊断方法故障传播路径机组高斯混合模型

结合用户习惯的笔记本适配测试方法及系统

适配测试方法习惯笔记本系统模型库指令

一种基于梯度的触觉拓扑映射模型构建方法

模型构建方法功能成像形态学特征特征值数据

基于扩展卡尔曼滤波和强化学习的束线站参数优化方法

站点导航

APP 下载