摘要
本申请公开了一种基于机器学习的医保基金违规使用挖掘方法及装置,该方法包括:对采集到的票据图像数据进行光学字符识别,得到对应票据的票面文本数据;将票面文本数据输入至大语言模型,提取出票面文本数据对应的有效数据信息,其中,有效数据信息包括票面文本数据中的购药相关信息;构建有效数据信息对应的各维度特征,计算各维度特征上每两张票据之间的票据相似度,筛选后得到一系列候选票据;基于票据相似度,从一系列候选票据中选定目标票据进行医保基金违规使用判断。
技术关键词
票据
挖掘方法
基金
文本
光学字符识别
数据
大语言模型
挖掘装置
药房
电子装置
图像
格式
存储器
计算机
处理器
组织
程序
系统为您推荐了相关专利信息
课堂教学场景
分类网络
构图结构
检测教师
多头注意力机制
生成方法
自动化部署运维
自愈机制
机器学习模型
预训练模型
生成指令
脚本
内容生成方法
计算机执行指令
画面