摘要
本发明公开了面向行业标准文档的深度语义实体与关系自动抽取方法,涉及文档智能化处理技术领域,包括:将文档页面图像输入多模态文档理解模型处理,得到多模态文档异构图;变换器架构模型处理,得到语义实体;多级噪声降噪神经网络生成训练数据集,进行抽取异构图,得到异构图;边导向图注意力网络模型融合,得到异构图实体识别的关系结果;共指消解模型对多模态文档异构图、语义实体、异构图及异构图实体识别的关系结果处理,结合训练后链接预测模型计算,得到全局知识网络。本发明提供一个更纯净、更可靠的训练数据集,提升模型的抽取精度。
技术关键词
语义实体
异构
多模态
关系
生成训练数据
页面
令牌
多层感知机
正则化技术
变换器
注意力机制
上下文无关文法
文本
三元组
图谱
分类器
逻辑
解码器模型
系统为您推荐了相关专利信息
动态密码
梅尔频率倒谱系数
动态时间规整
多模态
声纹特征
表征学习方法
计算机视觉
特征提取模型
解码器
网络
孤独症儿童
音频输出单元
蓝牙通信单元
LED光效
触控感应单元
原型验证方法
模块单元
资源使用量
原型验证装置
布线
显示装置
画面
背光驱动芯片
源极驱动芯片
主控模块