摘要
一种文档处理方法计算设备,该文档处理方法用于识别和处理文档记载的信息,包括:获取待处理文档,待处理文档记载的信息包括结构信息和内容数据,结构信息用于划分内容数据;获取待处理文档的结构信息;根据结构信息划分内容数据,以得到至少一个文档块;根据每个文档块中内容数据的版式,确定每个文档块对应的预设处理算法;根据预设处理算法,确定每个文档块中的内容数据;根据结构信息和每个文档块中的内容数据,得到已处理文档。本申请中,已处理文档是一种以文档块为存储单位的结构化数据,这样,在从知识库中匹配用户输入问题的内容数据时,可以从知识库中匹配不同文档块中的内容数据,匹配的内容数据的精确度和准确性更高。
技术关键词
表格
数据
文字识别算法
存储程序代码
文本
图像
处理器
存储器
编辑
指令
系统为您推荐了相关专利信息
配电站房
三维模型
数字孪生
网络传输单元
数据采集单元
智能网联车辆
换道模型
信号交叉口
强化学习算法
车道
三维模型
稠密点云
扫描系统
畜牧养殖信息化技术
图像
睡眠纺锤波
电信号
信噪比
多模态生理
支持向量机