摘要
本发明涉及圆形重建算法技术领域,公开了一种基于强化学习的圆形重建系统,该系统运用马尔可夫决策过程来描述多圆弧的重建过程,即估计一条圆弧的参数即对应做一个决策,估计多条圆弧的参数则对应做多个决策。本发明通过环境模块接收智能体模块输出的动作,使用平均测度估计子来计算该动作产生的奖励,根据该动作转变环境状态,并将产生的奖励和转变后的状态反馈给智能体;通过智能体模块接收环境模块输出的奖励和状态,产生新的动作并反馈给环境模块,并使用PPO强化学习算法优化更新智能体的动作策略;通过记录模块记录智能体和环境交互过程中的最佳分幕,最佳分幕里包含的各个动作。得益于平均测度估计子的高鲁棒性和PPO算法的高稳定性。
技术关键词
重建系统
模块
模型误差
重建算法技术
边缘检测算子
参数
强化学习算法
高斯滤波器
动作策略
网络
数据
决策
图像
偏转角
鲁棒性
圆心
像素点
系统为您推荐了相关专利信息
排放预测方法
多源异构数据
特征选择方法
碳排放预测技术
燃料消耗数据
时间同步设备
时钟组件
线路转换器
GPS接收器
组合式
数据控制系统
数据分析模块
监测模块
数据获取模块
数据采集模块