摘要
本公开提供一种深度强化学习的覆盖率测试方法、装置、设备及存储介质。所述方法包括:获取深度强化学习模型中智能体的初始状态和历史状态集合;通过高斯噪声算法根据所述初始状态得到候选状态,利用所述历史状态集合构建分层数据结构;根据所述分层数据结构确定所述候选状态到所述历史状态集合的目标欧氏距离,基于所述目标欧氏距离确定所述候选状态的候选覆盖率;基于所述候选覆盖率以及当前状态的当前覆盖率,从所述候选状态和所述当前状态中确定最优测试用例。这样,能够在高维连续空间准确地计算候选状态的候选覆盖率,并且不需要对历史状态集合进行离散化,避免因离散化产生的覆盖率误差,实现更精准的连续状态空间覆盖率量化。
技术关键词
分层数据结构
覆盖率测试方法
深度强化学习模型
覆盖率测试装置
连续状态空间
噪声
概率密度函数
算法
计算机
处理器
模块
存储器
电子设备
指令
参数
误差
程序
系统为您推荐了相关专利信息
深度强化学习模型
卸载方法
计算方法
卸载策略
注意力机制
翼型结构
连续状态空间
稳定性评估方法
空间分析模型
构建耦合系统
深度强化学习模型
蒙特卡洛树搜索
干扰效能评估方法
策略
节点
自主水下航行器
深度Q网络
决策网络模型
增量更新
正则化方法