摘要
本发明提供一种多辊协同皮带纠偏控制方法和系统,包括:将当前皮带边缘与皮带边缘设定值进行比较,得到每个纠偏辊与标准边缘线相交处的像素关联点的偏移距离及偏移速度,结合纠偏辊角度,构建状态向量;经过强化学习模型的策略网络输出动作,将动作与状态向量合并成状态动作对,输入动作重构模型对动作进行重构,并输出安全动作用于后续的电机控制;状态动作对还会输入强化学习模型的动作价值网络和动作成本网络,对策略网络输出的动作进行评估。本发明可以对皮带进行纠偏控制。
技术关键词
纠偏辊
多智能体深度强化学习
注意力机制
网络
纠偏控制方法
重构模型
深度强化学习模型
皮带
轨迹
策略
边缘检测技术
特征提取能力
矩阵
离线
数据增广方法
伺服电机驱动器
动态
定义