摘要
本申请公开了一种基于大模型的电子凭证混合解析方法、设备及介质,方法包括:收集历史数据,根据预先设置的数据形式对历史数据进行标注,并对标注后的历史数据进行向量化处理;将向量化处理后的历史数据输入至预先确定的数据模型中,以对数据模型进行训练,并确定预先设置的特定任务,根据特定任务对训练后的数据模型进行调整,以得到垂直领域模型;确定电子凭证信息,对电子凭证信息进行分区识别,以确定电子凭证信息对应凭证文本内容,并根据文本内容确定文本信息;将文本信息输入至垂直领域模型,以确定提示词工程,根据提示词工程对电子凭证信息进行纠错和校正,并对校正后的电子凭证信息进行格式化输出。本申请提高了凭证解析的准确性。
技术关键词
电子凭证信息
文本
格式化
解析方法
计算机可执行指令
分区
解析设备
校正
数据
纠错
识别算法
处理器通信
存储器
介质