摘要
本申请公开了一种无线传感器网络的路由确定方法及装置。其中,该方法包括:获取在学习模型的离线阶段创建的决策模型对应的状态价值函数,其中,决策模型是根据在离线阶段获取的状态空间、动作空间、状态转移模型和奖励函数构建的;对状态价值函数进行迭代直到状态价值函数收敛,得到最优状态价值函数,并基于最优状态函数确定每对状态和动作的最优Q值;在学习模型的在线阶段,基于每对状态和动作的最优Q值和无线传感器中每个节点目前时刻的状态生成每个节点在目标时刻的路由动作。
技术关键词
无线传感器网络
节点
状态转移模型
历史运行数据
离线
阶段
决策
存储程序指令
生成随机数
链路
计算机程序产品
存储器
在线
处理器
计算机设备
参数
指标
模块
系统为您推荐了相关专利信息
试验机液压系统
能效评估模型
优化控制方法
压剪试验机
强化学习算法
排序方法
网络节点
社交网络图
非暂态计算机可读存储介质
社会网络分析