摘要
本发明涉及人工智能技术领域,可应用于保险业务领域,本发明公开了基于强化学习的策略制定方法、装置、设备及存储介质,方法包括:获取报价系统中的预设客户数据和预设市场数据;将预设市场数据和预设客户数据组成状态数据,将状态数据、动作数据、奖励数据组成样本数据;采用样本数据训练深度强化学习模型,获取训练后的深度强化学习模型;基于训练后的深度强化学习模型,确定第一客户组的报价策略的成功率;基于第一客户组的报价策略的成功率,得到优化后的深度强化学习模型;通过优化后的深度强化学习模型处理目标客户数据,得到目标客户数据的报价策略。本发明有利于提高目标客户数据的报价策略的成功率。
技术关键词
深度强化学习模型
策略制定方法
客户
数据
报价系统
样本
可读存储介质
人工智能技术
处理器
聚类算法
模块
计算机设备
存储器
接口
参数
系统为您推荐了相关专利信息
单轨吊设备
路径设计方法
数据处理单元
注意力机制
视觉摄像头
DBSCAN算法
路径分析系统
病毒
蚂蚁
路径分析技术
视频帧
网格
医疗视频数据
视频缓存方法
视频压缩