摘要
本发明提供一种基于强化学习智能体的检验检测试验排期方法,涉及试验排期技术领域。该方法包括:设计检验检测试验任务排期环境,采集和管理任务数据,模拟任务排期和执行,建立奖励函数模型;建立状态嵌入智能体,将排期状态对应到特征空间;建立神经网络模型实现的排期决策智能体,依据奖励机制,智能体在排期管理环境进行状态搜索,最大化累积奖励得分,训练调整智能体的决策参数;持续训练神经网络模型,直至模型满足预设的训练和验证条件。利用基于神经网络的强化学习技术,设计检验检测试验排期环境,整合数据及试验排期所需要满足的限制条件,建立排期决策神经网络模型,实现满足试验排期环境限制的智能化排期,从而提高了试验排期效率。
技术关键词
排期方法
训练神经网络模型
人力资源数据
决策
试验设备
建立神经网络模型
编解码器
强化学习技术
历史运行数据
队列
生成随机数
编码
标记
机制
参数
数值
基础
关系
系统为您推荐了相关专利信息
深度Q神经网络
锂离子电池组
深度Q网络
管理策略
锂离子电池内阻
对齐方法
仿真环境
轨迹预测模型
规划
大语言模型