摘要
本申请公开了一种收据识别方法、装置、设备及介质,涉及票据内容识别技术领域。该方法包括:通过预设采集方式获取收据图像,并利用预设光学字符识别模型对收据图像进行识别,以确定收据图像中的文字内容和相应的位置信息;将收据图像在预置的多模态大模型提示词库中进行信息匹配以得到第一提示词,并将第一提示词、文字内容以及位置信息输入至预设多模态大模型,以得到关键信息键值对;将收据图像在预置的语言大模型提示词库中进行信息匹配以得到第二提示词,并将第二提示词、文字内容、位置信息以及关键信息键值对输入至预设语言大模型,以得到目标关键信息键值对。通过本申请的技术方案,可以提升非标准收据关键字段内容识别的准确率。
技术关键词
收据
键值
识别方法
交叉注意力机制
多模态
直方图均衡化算法
光学字符识别技术
存储计算机程序
内容识别技术
校正模块
YOLO算法
识别模块
变换器
连线
图像增强