一种基于强化学习的车险准备金动态计算方法及装置

正文

推荐专利

申请号：CN202510659275

申请日期：2025-05-21

公开号：CN120672479A

公开日期：2025-09-19

类型：发明专利

摘要

本发明提供一种基于强化学习的车险准备金动态计算方法及装置，所述方法包括：S1、智能驾驶背景下对车险准备金的设计和优化进行分析，优化目标为最小化准备金不足风险和最大化资金利用效率；S2、重构所述优化目标，包括设计目标优化强化学习模型的状态空间、动作空间和奖励函数；S3、以最大化累计折扣奖励的同时最大化策略的熵为准则，训练所述目标优化强化学习模型，并基于经验回放机制更新所述目标优化强化学习模型的评价网络和策略网络；S4、训练完成后，获得最优准备金，平衡资金充足性与使用效率。本发明可以对车险准备金进行动态计算。

技术关键词

强化学习模型动态计算方法资金策略网络广义线性模型风险因子修正偏差重构模块时序特征状态更新分析模块机制符号天气基准

一种基于强化学习的车险准备金动态计算方法及装置

站点导航

APP 下载