基于深度强化学习的环境探索方法、装置及电子设备

正文

推荐专利

申请号：CN202510320706

申请日期：2025-03-18

公开号：CN120278224A

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开了一种环境探索方法，具体是涉及到一种基于深度强化学习的环境探索方法、装置及电子设备。本发明创新性地引入对比学习机制，模拟人类通过对比强化关键信息识别的认知过程，在高维特征空间中对不同效用等级的节点施加对比约束，实现潜在表征解耦，使决策网络精准捕获关键区域特征，显著提升最优视点选择精度。同时，本发明设计了一套包含强制动作约束的训练规则，以优化决策路径。此外，本发明还提出了一种创新的图稀疏化算法，通过自适应图结构的简化，在保持性能标准的同时简化了计算复杂度。本发明在保持计算成本最低的同时，实现了5.6％的性能提升，为机器人、无人机等设备在大规模环境中的自主探索提供了全新的解决方案。

技术关键词

深度强化学习网络地图节点解码器决策样本编码器生成动作注意力地面稀疏算法电子设备标志变量线性存储器邻居处理器模块

系统为您推荐了相关专利信息

耳机充电盒的充电方法和装置、电子设备及存储介质

设备运行数据耳机充电盒充电方法训练样本数据蓝牙耳机

双路径Torus网络的路由方法、装置、芯片、设备和存储介质

节点通道非易失性可读存储介质网络计算机可读代码

一种基于强化学习的飞行汽车油冷器多物理场协同控制方法

多物理场协同飞行汽车连续动作空间在线学习机制相变材料模块

一种三辊变径斜轧全流程工艺开发辅助平台

数据库存储单元辅助平台集成神经网络轧辊轴类零件

一种基于数据分析的物联网卡套餐配置方法和系统

数据聚类样本神经网络学习技术转换词典

基于深度强化学习的环境探索方法、装置及电子设备

站点导航

APP 下载