摘要
本发明的用于知识问答系统的双流解码器表格结构化知识加工方法,该方法通过构造训练表格图像数据的背景二值图像;通过神经网络对背景二值图像进行提取,构建双流解码器模型处理提取后的二值图像数据,获取预测可见线图、不可见线图和表格单元格顶点;根据可见线图、不可见线图和表格单元格顶点设计损失函数,优化双流解码器的参数;通过优化后的双流解码器模型生成最终表格。本发明在Tracetable方法基础上优化,通过语义分割的方式直接预测表格单元格的多种属性图。并通过双流解码器分别预测可见行列线图和不可见行列线图、顶点图。同时,本发明通过Focal Loss和根据表格特点改造后的SegLoss结合训练来降低类别不平衡的影响,更加关注区域结构的完整性。
技术关键词
知识问答系统
表格
解码器模型
顶点
像素点
图像构造方法
代表
编解码结构
坐标
编码器
数据
标签
计算机设备
邻居
邻域
语义
参数