一种无人夹抱车强化学习规控算法的评价网络设计方法

正文

推荐专利

申请号：CN202510103088

申请日期：2025-01-22

公开号：CN120046690A

公开日期：2025-05-27

类型：发明专利

摘要

本发明公开了一种无人夹抱车强化学习规控算法的评价网络设计方法，本发明通过高质量离线正样本融入评价网络的训练过程中，加速强化学习规控算法收敛并减少试错探索时间以提升作业效率；同时构建专门的评价网络融合层，依据离线正样本可信度与在线训练可信度动态调整权重，将离线正样本信息与在线训练特征融合，充分挖掘其有效作业策略，增强评价网络准确性与稳定性，最终实现整个强化学习规控算法性能的显著提升，有效推动无人夹抱车在复杂物流环境中的高效、精准作业。

技术关键词

网络设计方法样本夹抱车作业场景离线融合策略在线算法序列训练特征融合网络基础架构作业策略优化器数据参数计算误差训练集

系统为您推荐了相关专利信息

故障诊断方法、装置、设备、存储介质和程序产品

特征提取模型深度信念网络电力设备训练样本集受限玻尔兹曼机

一种基于多元互学习网络的高光谱图像迁移分类方法

分类方法标签类别二分类器邻域搜索方法样本

一种多阶段融合循环神经网络的间歇过程温度预测方法

DBSCAN聚类算法温度预测方法多阶段数据融合特征

拍摄指导信息的处理方法、装置、电子设备及计算机可读存储介质

拍摄指导信息排版主题图片视觉样本

一种车险理赔金额的预测方法、装置、介质及设备

联邦模型车险理赔金额参数客户端预训练模型

一种无人夹抱车强化学习规控算法的评价网络设计方法

站点导航

APP 下载