摘要
本发明提出一种基于深度强化学习的卫星与自主农机网络DRCO方法,所述方法包括:S1、建立卫星与自主农机一体化网络架构,包括卫星节点、地面任务生成中心和自主农机终端节点;S2、将卫星与自主农机联合计算卸载问题建模为马尔科夫决策过程,定义时变的卫星信道增益、计算任务以及各终端完成任务的相对时间为输入变量,构建计算卸载决策和带宽分配的次优解优化模型;S3、提出基于深度强化学习的卫星与自主农机网络DRCO方法,采用保序量化技术,生成计算卸载决策和带宽分配方案数据。本发明采用保序量化技术,在短时间内保证决策质量。DRCO能够快速适配高随机性卫星网络,显著提高动态环境下的决策性能。
技术关键词
农机一体化
时延
决策
信道
网络架构
地面
深度强化学习方法
训练深度神经网络
农机设备
Sigmoid函数
动态变化模型
能耗
节点
定义
终端
功率
系统为您推荐了相关专利信息
养殖环境监测
自动调控系统
决策控制模块
能源管理模块
人机交互模块
调控方法
参数
加权欧氏距离
决策
工业自动化控制技术
柔性作业车间
联合调度方法
超参数
声音传播速度
联合调度系统
项目
层次分析法
指标决策方法
数据分析模块
数据获取模块
稳定控制方法
人机系统
电机驱动模块
决策算法
轨迹误差