摘要
本发明提供一种文本提取方法、装置及电子设备,属于人工智能技术领域。所述方法包括:对待提取图像中的文本进行识别,得到第一格式下的第一文本;基于第一格式对应的第一语法规则,确定文本片段以及对应的片段类型;基于转换提示词和每个文本片段的片段类型,将第一文本转换为第二格式下的第二文本;利用校验提示词对第二文本进行合理性校验,以得到通过合理性校验的第三文本;基于映射提示词,引导映射模型建立第三文本和指定字段之间的映射关系,并基于映射关系从第三文本中提取指定字段对应的指定文本。本发明通过设置不同的提示词,可充分利用语言模型的能力提取文本,从而可实现高效地提取文本。
技术关键词
文本提取方法
字段
模板
格式
元素
校验模型
建立映射关系
文本提取装置
样式
电子设备
人工智能技术
校验模块
存储器
识别模块
语义
图像
处理器
组织
系统为您推荐了相关专利信息
神经网络预测模型
智能交通监控方法
多模态数据融合
智能交通监控系统
节点特征
智能合约漏洞
大语言模型
模型预训练
扫描工具
项目
可见光图像
图像恢复策略
跟踪方法
注意力模型
站台