摘要
本发明公开了一种基于多模态解析的税务政策文件处理方法,属于税务政策文件处理技术领域,包括:根据税务政策文件,通过区域划分,以识别区域类型,并得到置信度;根据置信度自大而小排序,得到第一置信度及第二置信度,当第一置信度及第二置信度的差值大于等于置信阈值时,则确定文件区域为第一置信度对应的区域类型;否则,根据第一置信度及第二置信度对应的两个区域类型的类型重合率,调整确定文件区域对应的区域类型;根据得到的区域类型,对文件区域内的数据,执行数据预处理,提取单模态特征,通过税务政策文件中多个文件区域得到的单模态特征,进行多模态融合,以得到知识图谱。通过区域的准确划分,执行多模态融合,实现文件准确解析。
技术关键词
多模态
模态特征
表格区域识别
文本
术语
存储计算机程序
图谱
计算机程序产品
数据
关系
处理器
检测器
节点
表达式
词典
页面
存储器
系统为您推荐了相关专利信息
文本
深度神经网络
电网资产评估技术
Attention机制
设备状态信息
驾驶状态检测方法
行驶状态信号
视觉特征
方向盘
波动特征