摘要
本发明公开一种基于深度强化学习的端到端自主运动决策方法,该方法涉及多机器人运动、机器学习、集成决策等领域。首先采用改进Mamba‑YOLOv10实现对玻璃制品的精准识别;然后针对端到端自主运动的数据依赖问题,提出将经验回放机制HER和设计的奖励函数应用到深度Q网络中,实现HER‑DQN的集成式决策框架。与其他方法相比,本发明不仅能够在复杂光照条件和环境干扰下精准识别玻璃制品,还能提高生物化学实验室转运机器人在自主运动决策时的稳定性和鲁棒性,设计的端到端自主运动决策方法具有实时性和高效性,能够使生物化学实验室转运机器人安全自主的完成执行任务,可应用于农业、工业、服务业等领域都有有益成效。
技术关键词
玻璃制品
稀疏卷积神经网络
深度强化学习
决策方法
生物化学实验室
DQN算法
移动机器人系统
转运机器人
深度Q网络
地点
控制机器人运动
传感器模块
样本
远距离
可视化工具
机器人本体
动态
光照
系统为您推荐了相关专利信息
原型
机器人避障方法
情景
概率密度函数
决策方法
辅助决策方法
综合评估模型
指数
水库
生物需氧量
废弃塑料再生
狼群算法
神经模糊推理系统
性能关联分析
风险
飞机系统健康状态
维修决策方法
飞机飞行数据
涡流检测信号
历史运行状态
优化控制模型
能效
智能优化控制方法
工业空调
深度强化学习算法