摘要
本发明公开了一种基于深度强化学习的飞机蒙皮视点规划方法和系统,包括:将视点规划问题建模为马尔可夫决策问题,基于传感器视野约束与被测对象的CAD模型计算状态空间与动作空间;创建AC框架的六自由度仿真环境,通过自定义奖励函数和动态经验池机制训练智能体;采用高斯混合模型生成渐进式训练环境,结合异步参数更新策略突破连续空间的探索瓶颈;最终将虚拟训练策略迁移至实体扫描机器人,获得视点规划策略,完成六自由度大范围连续空间视点规划。该方式显著提升了视点规划的泛化性,能够提供更丰富的状态信息,帮助智能体学习到数据中的潜在结构,在复杂或未知环境中做出更合理的决策,提高整体性能。
技术关键词
高斯混合模型
飞机蒙皮
视点规划方法
扫描仪
深度强化学习
网络架构
策略
覆盖率
贪婪算法
贝叶斯信息准则
搭建模块
后验概率
定义
参数
强化学习网络
扫描机器人
训练智能体
单轮
系统为您推荐了相关专利信息
电驱动装载机
输出管理方法
深度强化学习
能量管理控制器
管理控制策略
生成加密密钥
特征值
隐私保护方法
电网频率偏差
通信信道
金属表面强化方法
三维重构技术
三维扫描仪
转台
金属表面强化装置
铁路调车作业
预警装置
线阵激光扫描仪
固态激光雷达
混合通信网络
动态配置方法
教师
资源配置优化
全局最优引导
粒子群优化算法