摘要
本发明涉及人机协同技术领域,公开了一种人机协同高实时性功能测试方法、设备、介质及程序产品,构建故障树模型,根据中间事件对应的底事件重叠关系对测项属性进行分组;利用蒙特卡洛模拟对强化学习模型的演员网络进行预训练初始化;以所述演员网络参数初始化每个测项属性组对应的演员网络,选择状态转移动作,计算即时奖励和累计奖励,利用时序差分误差及策略梯度优化评论家网络和演员网络的参数;将各测项属性组的测试策略组合为所有测项属性的整体测试策略。本发明一方面避免了纯数据驱动建模方法无法准确建模测项属性间耦合关系的问题,另一方面基于专家经验引导强化学习算法的改进,提高了强化学习算法的收敛速度。
技术关键词
功能测试方法
蒙特卡洛
强化学习模型
网络
贪婪策略
故障树模型
强化学习算法
数据驱动建模方法
时序
人机协同技术
参数
误差
计算机程序产品
处理器
主板
序列
计算机设备
关系
系统为您推荐了相关专利信息
基站
流量预测模型
采样点
功率优化
神经网络算法
动静态
YOLO算法
卷积神经网络提取
空间特征提取
静态特征