基于强化学习的策略制定方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510533510

申请日期：2025-04-25

公开号：CN120598625A

公开日期：2025-09-05

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于保险业务领域，本发明公开了基于强化学习的策略制定方法、装置、设备及存储介质，方法包括：获取报价系统中的预设客户数据和预设市场数据；将预设市场数据和预设客户数据组成状态数据，将状态数据、动作数据、奖励数据组成样本数据；采用样本数据训练深度强化学习模型，获取训练后的深度强化学习模型；基于训练后的深度强化学习模型，确定第一客户组的报价策略的成功率；基于第一客户组的报价策略的成功率，得到优化后的深度强化学习模型；通过优化后的深度强化学习模型处理目标客户数据，得到目标客户数据的报价策略。本发明有利于提高目标客户数据的报价策略的成功率。

技术关键词

深度强化学习模型策略制定方法客户数据报价系统样本可读存储介质人工智能技术处理器聚类算法模块计算机设备存储器接口参数

系统为您推荐了相关专利信息

一种用于单轨吊设备的距离探测及转弯路径设计方法

单轨吊设备路径设计方法数据处理单元注意力机制视觉摄像头

一种面向音符粒度的自动视唱音准评分方法及终端

评分方法序列音频声学特征动态时间规整算法

基于大数据的病毒传播路径分析系统

DBSCAN算法路径分析系统病毒蚂蚁路径分析技术

一种基于AI初始场驱动NWP区域模式并融合涡旋动力初始化的台风强度预测方法、介质及计算机程序

强度预测方法模式多源观测数据海洋动力

医疗视频缓存方法和装置、电子设备及存储介质

视频帧网格医疗视频数据视频缓存方法视频压缩

基于强化学习的策略制定方法、装置、设备及存储介质

站点导航

APP 下载