摘要
本发明公开了一种基于动态回放池的风险管理方法、装置及电子设备,其装置包括:基于大语言模型的动态数据集生成模块,用于根据离线数据集和实时环境状态向量生成动态数据集;基于动态数据集和深度神经网络的状态序列生成模块,用于训练状态转移模型并生成状态序列;基于模型不确定性的动态回放池更新模块,用于利用优先级队列的方法对动态回放池进行更新;基于动态回放池的状态转移模型优化模块,用于根据动态经验回放池和梯度下降法对状态转移模型的参数进行更新;风险管理策略生成模块,用于根据最新的状态转移模型得到实时优化的风险策略函数。本发明解决了现有智能风险管理方法不能根据决策环境的动态变化持续优化导致策略失效的问题。
技术关键词
状态转移模型
风险管理方法
动态数据集
大语言模型
深度神经网络训练
决策
离线
正确率
覆盖率
风险管理装置
序列
估计算法
管理策略
数据格式
模块
系统为您推荐了相关专利信息
电路生成方法
生成服务器
大语言模型
检索技术
模版
融合特征
有向图结构
特征提取模块
计算机设备
大语言模型
攻击防御方法
大语言模型
学习系统
重构
进化策略