摘要
本申请实施例提供了一种车险欺诈行为的识别方法、装置、电子设备、介质及产品,属于人工智能技术领域。该方法包括:将各个车险理赔案件信息输入至神经网络模型,得到各个案件的各个理赔动作的选择概率;根据选择概率确定目标理赔动作。根据目标理赔动作和参考理赔动作确定目标理赔动作的奖励值,将各个奖励值的和值确定为模型的累积奖励。根据累积奖励和第一期望梯度确定第二期望梯度。最后,根据第二期望梯度迭代更新模型参数得到车险欺诈行为识别模型。如此,通过将各个车险理赔案件的信息输入神经网络模型,得到模型的累积奖励,并通过强化学习根据模型参数的期望梯度更新模型参数,可以优化模型的反欺诈策略,提高车险欺诈行为识别的准确度。
技术关键词
车险理赔案件
识别方法
更新模型参数
电子设备
输入神经网络模型
计算机程序产品
识别装置
可读存储介质
人工智能技术
处理器
输入模块
存储器
策略
因子
系统为您推荐了相关专利信息
生成模型训练方法
大语言模型
解码图像
解码器
文本
模型构建方法
三维模型
非暂态计算机可读存储介质
模型构建装置
点云
文本特征向量
语音识别方法
座舱
音色特征
语音识别装置
基因表达数据
差异表达基因
标志物
表达式
网络分析