摘要
本发明公开了一种基于强化学习的人机协作任务分配方法,包括:构建包含任务定义、资源定义、状态空间、动作集合与奖励函数的强化学习模型,并利用异构图神经网络对人机协作中的任务、工人与机器人之间的协同关系建模,提取状态空间的高阶特征。基于此特征,通过近端策略优化算法训练策略网络与价值网络,实现高效任务分配策略的学习。奖励函数结合任务完成时长与资源利用率,兼顾生产效率与资源平衡。系统运行过程中实时采集车间状态数据动态更新状态空间,强化学习模型依据最新状态生成最优分配动作并指令下发至工人或机器人执行。本发明具备自适应性强、分配效率高、调度智能化程度高等优势,适用于智能制造等复杂动态环境下的任务调度优化。
技术关键词
强化学习模型
任务分配方法
人机协作
机器人
资源定义
节点特征
任务分配策略
网络
异构
关系建模
多层感知机
联合损失函数
矩阵
消息
操作者
作业车间