摘要
本发明提供一种基于深度强化学习的智能行为建模系统,涉及数据处理技术领域,所述方法包括:从智能体的监测设备中获取智能体的历史状态数据,并将其按照监测时间进行匹配,得到交互数据集,根据交互数据集,得到多维状态向量数据集和标准动作指令数据集,构建智能体的环境空间和行为空间,计算在不同环境空间中智能体执行行为空间中行为的执行结果值,基于深度Q网络构建初始智能行为建模模型,并根据环境空间、行为空间和奖励反馈值,对初始智能行为建模模型进行训练,得到智能行为建模模型,获取智能体的实时状态数据,并将其输入至智能行为建模模型,得到决策行为。本发明能够基于深度强化学习算法对智能体进行行为建模。
技术关键词
建模系统
状态向量数据
动作指令数据
深度Q网络
空间模块
监测设备
速度
深度强化学习算法
能源
回收池
模型训练模块
特征提取模块
数据处理技术
数据处理模块
数据采集模块
决策
索引
系统为您推荐了相关专利信息
芯片测试方法
深度学习优化
系统级芯片测试
卷积神经网络提取
多层感知机
汽车零件表面
缺陷检测系统
蓝光三维扫描仪
图像预处理系统
主动锥形齿轮
综合诊断系统
启停状态识别
状态图像数据
异常设备
数据处理模组
路径规划算法
输电杆塔
设备实时状态
视觉识别系统
动态规划算法