摘要
本发明公开了多模态多证件信息抽取方法、装置、计算机设备及存储介质。方法包括:获取原始证件图片;对原始证件图片进行对齐,以得到对齐结果;对对齐结果进行分类,以得到分类结果;基于分类结果构造提示词;将提示词以及对齐结果输入至多模态信息抽取模型中进行信息抽取,以得到抽取结果;对抽取结果进行校正,以得到校正结果;输出校正结果。通过实施本发明的方法可实现提供高准确率、强鲁棒性及高效运行的多证件信息抽取解决方案,能够标准化处理并提取全球各类证件的关键信息,以解决依赖于模板匹配和特定规则,导致对多样化的证件样式适应性差、多语言支持不足且需要大量标注数据,同时在处理图像质量问题和复杂背景时表现不佳。
技术关键词
信息抽取方法
证件图片
信息抽取模型
计算机设备
自动化工具
多模态信息
证件图像
强鲁棒性
校正单元
多语言
处理器
格式
存储器
字段
样式
日期
系统为您推荐了相关专利信息
坐标系建立方法
高度传感器组件
辅助工具
轨迹
机器人
多层感知机
变工况
下齿轮箱
节点数
故障诊断方法
数据生成方法
计算机可读指令
客户
数据生成装置
模板
数据查询方法
机器学习算法
流量预测模型
数据查询系统
资源分配