摘要
本发明公开了一种基于强化学习的人机协同拆解退役动力电池任务序列优化方法,其采用离线的决策方法,首先通过数据库获得待拆解目标的完整信息,基于信息确定待拆解工件的拆解树模型。在确定待拆解工件的结构后创建强化学习环境,并使用Q‑learning算法引导双智能体进行探索学习,最后获得人机协同拆解最优序列。本发明提供了一种具有动态适应性的,优化效率高的电池拆解方法,通过结合工作台上的机器视觉捕捉的相关数据,与本地的电池包三维模型对比,得到基于现实情况的虚拟拆解环境,智能体在环境中交互得到的最优拆解策略即为基于真实工件状态下的最优拆解策略。
技术关键词
序列优化方法
退役动力电池
强化学习环境
人机协同
策略
电池拆解方法
动力电池模型
现场视觉
强化学习算法
零件
决策方法
感知系统
网络架构
三维结构
线段
三维模型
工件
参数
电池包