一种无人夹抱车强化学习规控算法的评价网络设计方法

AITNT
正文
推荐专利
一种无人夹抱车强化学习规控算法的评价网络设计方法
申请号:CN202510103088
申请日期:2025-01-22
公开号:CN120046690A
公开日期:2025-05-27
类型:发明专利
摘要
本发明公开了一种无人夹抱车强化学习规控算法的评价网络设计方法,本发明通过高质量离线正样本融入评价网络的训练过程中,加速强化学习规控算法收敛并减少试错探索时间以提升作业效率;同时构建专门的评价网络融合层,依据离线正样本可信度与在线训练可信度动态调整权重,将离线正样本信息与在线训练特征融合,充分挖掘其有效作业策略,增强评价网络准确性与稳定性,最终实现整个强化学习规控算法性能的显著提升,有效推动无人夹抱车在复杂物流环境中的高效、精准作业。
技术关键词
网络设计方法 样本 夹抱车 作业场景 离线 融合策略 在线 算法 序列 训练特征融合 网络基础架构 作业策略 优化器 数据 参数 计算误差 训练集
系统为您推荐了相关专利信息
1
故障诊断方法、装置、设备、存储介质和程序产品
特征提取模型 深度信念网络 电力设备 训练样本集 受限玻尔兹曼机
2
一种基于多元互学习网络的高光谱图像迁移分类方法
分类方法 标签类别 二分类器 邻域搜索方法 样本
3
一种多阶段融合循环神经网络的间歇过程温度预测方法
DBSCAN聚类算法 温度预测方法 多阶段 数据 融合特征
4
拍摄指导信息的处理方法、装置、电子设备及计算机可读存储介质
拍摄指导信息 排版 主题图片 视觉 样本
5
一种车险理赔金额的预测方法、装置、介质及设备
联邦模型 车险理赔金额 参数 客户端 预训练模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号