一种基于值分布环境模型的策略评估系统及风险管控方法

AITNT
正文
推荐专利
一种基于值分布环境模型的策略评估系统及风险管控方法
申请号:CN202411933299
申请日期:2024-12-26
公开号:CN119377624B
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种基于值分布环境模型的策略评估系统及风险管控方法,包括:筛选离线数据模块:筛选离线数据并根据四元组数据格式生成离线数据集;基于值分布的奖赏值分布模型构建模块:根据值分布学习和四元组离线数据集建立损失函数,根据损失函数构建基于值分布的奖赏值分布模型;状态转移模型构建模块:根据四元组离线数据集训练状态转移模型;状态序列生成模块:根据奖赏值分布模型和状态转移模型生成状态序列;策略评估模块:评估状态序列的收益,根据状态序列的收益得到策略评估结果。本发明解决了目前策略评估方法中策略评估效率低、结果稳定性和可靠性不足的问题。
技术关键词
状态转移模型 评估系统 序列 离线 模型误差 风险管控方法 深度神经网络 策略评估方法 数据格式 交通状态信息 传播算法 数据模块 位点 累积分布函数 车辆状态信息 概率分布函数 模型预测值 安全带
系统为您推荐了相关专利信息
1
网络服务控制方法、装置、设备、存储介质及产品
网络服务控制方法 联网设备 硬件序列号 网络通信模组 服务端
2
中央空调COP监测方法
中央空调系统 监测方法 空调机组系统 数据 时序预测模型
3
飞机轨迹的预测模型训练方法和飞机轨迹的预测方法
轨迹 归一化模块 样本 注意力 预测模型训练方法
4
一种考虑设备预防性维护的并行流水车间分批调度方法
流水车间调度 系统停机时间 划分方法 果蝇算法 批量
5
表情包生成方法、装置、电子设备、介质及程序产品
强度随时间变化 对象 生成表情 视频 生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号