摘要
本发明公开了一种基于大模型的提取文档可信证据方法及系统,包括以下步骤:破损文档证据完形推理:构建图像、文本双分支模型,其中:图像分支通过融合跨模态注意力机制的改进型架构捕捉文档破损区域的边缘纹理,生成缺失区域的像素级预测掩码;文本分支基于在BERT基础上增加领域术语嵌入层并经文档证据语料微调的衍生模型,对残缺文本进行掩码语言建模,结合上下文语义及领域术语库生成候选补全内容,本发明通过图像、文本双分支模型的跨模态融合机制,结合改进型物理破损特征提取与领域适配语义补全模型,使破损文档证据提取的完整性与准确性显著提升,实现了破损区域像素级修复与语义逻辑连贯的双重优化。
技术关键词
溯源数据库
光学字符识别
红外扫描仪
检测挥发性有机物
文本
检测子系统
分支
术语
气相色谱仪
贝叶斯神经网络
跨模态
多标签分类器
指纹
交叉注意力机制
语义特征
实体
图像
工业相机
系统为您推荐了相关专利信息
司机
网约车
文本分析技术
个性化路径推荐
深度学习算法
智能问答方法
层次聚类算法
答案
电力设备参数
节点
游戏
资源推荐方法
图形用户界面
账户推荐
虚拟对象
文本段落
文本解析方法
目录
计算机存储介质
树形数据结构