摘要
本发明涉及人工智能及医疗健康和金融技术领域,公开了文本提取重建方法、装置、计算机设备及存储介质。所述方法包括:获取待处理文本图像;将所述待处理文本图像输入至文本提取重建模型中进行文本重建,以得到目标文本图像;其中,所述文本提取重建模型包括用于提取文本结构特征的文本感知编码器以及基于所述待处理文本图像以及文本结构特征生成目标文本图像的扩散模型;输出所述目标文本图像。通过实施本发明的方法可实现满足金融票据、病历文档及保险理赔材料等领域的高精度要求,不仅能显著提高OCR技术的识别精度,还能大幅提升业务自动化处理的效率和可靠性。
技术关键词
文本
编码器
计算机设备
布局
感知特征
多层感知机
图像获取单元
金融票据
医疗健康
语义特征
处理器
三元组
存储器
标签
注意力
病历
模块
网络