摘要
基于深度强化学习的动力电池拆解任务规划方法,涉及动力电池拆解技术领域,包括获取待拆解废旧动力电池的参数将参数输入至人机协同任务类型分配模型进行任务类型分配得到零部件的任务类型;对拆解任务进行拆解序列规划,确定最终拆解序列等步骤,本发明利用多层感知机神经网络为废旧动力电池的拆解任务单元确定合理的任务类型,将现实废旧动力电池拆解场景转换成强化学习环境,为智能体学习提供了一个现实的基础,利用多智能体深度强化学习结合随机Stackelberg博弈论框架解决任务规划问题并展示了基于再制造背景下训练逻辑的细节,以实现在满足废旧动力电池拆解要求的同时提高智能化水平的目的。
技术关键词
废旧动力电池
深度强化学习
人机协同
机器人
动力电池拆解技术
多层感知机
规划
Softmax函数
强化学习环境
序列
均衡策略
指标
参数
矩阵
算法
层级
决策