摘要
一种基于深度强化学习的协议适配参数确定方法,包括步骤:S1、构建设备信息库;S2、构建包括Actor网络和Critic网络的加权双延迟DDPG网络;加权双延迟DDPG网络根据设备信息输出用于确定基本信息相似度的相似度权重;加权双延迟DDPG网络与环境的交互包含协议群构建;协议群构建中每个设备协议生成任务为一个智能体,智能体根据奖励和状态执行动作;状态包括设备基本信息和相似度权重;动作包括增加相似度权重和减少相似度权重;Actor网络包括在线策略网络和目标策略网络;在线策略网络根据当前状态确定动作,目标策略网络根据下一步状态确定下一动作;S3、根据相似度权重,构建相似设备群;S4、构建协议群;对协议群中协议文本进行验证,获取适配协议。
技术关键词
深度强化学习
协议
网络
策略
在线
参数
梯度下降算法
最小化误差
代表
随机噪声
记忆
定义
文本
机制
样本
标识
元素
数据
系统为您推荐了相关专利信息
自动检测方法
特征提取器
深度学习网络模型
数据传输模块
异常数据
出行服务信息
智能决策方法
强化学习模型
车辆
动态
胶囊网络
轴承故障诊断方法
小波阈值去噪算法
语义向量
样本