摘要
本申请提供一种基于Q学习的联合信道和路由选择跨层决策方法,方法包括:获取坐标;每个路由节点周期性的广播用来发现、建立、保活邻居关系的报文;当邻居节点接收到Hello包后反馈确认报文,建立好邻居关系;当源节点有数据需要传输时,源节点按照选择策略选择出下一跳节点和信道传输数据包,数据包中包含选择的下一跳节点的地址;邻居点判断数据包是否应该由自己转发;下一跳节点通过控制链路向源节点回复,回复信息中包含估计的信干比和自己最新的Q表;源节点根据反馈的信干比和前期获得的位置用来计算奖励值;源节点根据奖励值更新Q表和节点选择策略。本方法提高了网络传输速率和抗干扰性能,减少了端到端的时延、跳数。
技术关键词
玻尔兹曼模型
源节点
通信信道
邻居
决策方法
策略
定义
估计信干比
报文
转移概率矩阵
速率
路径跳数
节点数
坐标
定时装置
周期性
链路