摘要
本发明公开了一种基于深度强化学习的无人集群任务资源分配方法,属于人工智能技术领域,所述方法包括:基于无人集群任务资源分配架构,建立无人集群任务资源分配问题的马尔可夫模型;并设计状态表示方式,用图像来对系统状态进行描述;基于卷积神经网络设计图像状态输入卷积神经网络;以所述图像状态输入卷积神经网络作为DQN模型的当前网络和目标网络,并引入迁移学习方法,构建出迁移深度强化学习模型;基于所述马尔可夫模型以及系统状态的图像描述,采用所述迁移深度强化学习模型进行策略学习,实现无人集群任务资源分配。采用本发明的技术方案,能够减少总体任务资源分配延迟并避免资源浪费。
技术关键词
资源管理中心
深度强化学习模型
资源分配方法
基地
马尔可夫模型
集群
队列
卷积神经网络设计
图像
迁移学习方法
资源占用状态
网格
代表
人工智能技术
决策
表达式
数据更新
系统为您推荐了相关专利信息
隐马尔可夫模型
测试方法
异常事件
反馈调节机制
维特比算法
货物出入库
空间布局信息
出入库作业
资源状态信息
智能应急
隐马尔可夫模型
维特比算法
序列
实时数据
Sigmoid函数
动态调度方法
协同决策机制
深度强化学习算法
动态障碍物
停车场车位状态