摘要
本申请提供一种医保欺诈检测方法、装置、计算机设备及存储介质,应用在医保系统上,所述方法包括:获取与医保欺诈相关的检测数据集,并对其进行预处理获得训练数据;对训练数据进行类别处理以获得重叠子集;对重叠子集进行欠采样和筛选处理以获得欺诈数据;对欺诈数据利用生成对抗网络获得生成数据,生成数据和训练数据构成目标训练数据,基于目标训练数据对用于识别医保欺诈的分类器进行训练。本申请通过对重叠子集进行欠采样处理以清晰两种类别的边界,以提高模型分类精度,再利用生成对抗网络生成欺诈类型的数据,以平衡目标训练数据中正常类型的样本数据和欺诈类型的样本数据的数量,进而提高分类器的分类准确率和分类效果。
技术关键词
数据
欺诈检测方法
生成对抗网络
计算机设备
医保系统
欺诈检测装置
噪声样本
分类器
信息熵
分类准确率
邻域
排序方法
处理器
存储器
程序
指令
编码
算法