摘要
本发明涉及自然语言处理技术领域,尤其涉及一种文件内容识别方法及文件内容识别装置。方法包括:对用户上传的待检测文件进行解析,得到至少一个待识别内容集合;对于每一待识别内容集合,从预设模型库中选择至少一个与该待识别内容集合相适配的目标识别模型对该待识别内容集合进行内容识别,并将所有目标识别模型针对该待识别内容集合的内容识别结果进行整合,得到该待识别内容集合对应的初始内容识别结果;对所有待识别内容集合对应的初始内容识别结果进行融合,得到待检测文件对应的目标内容识别结果。根据不同的内容类型选用不同的识别模型进行内容识别以提高文件内容自动识别的准确性,减少人工参与程度以提高内容识别效率。
技术关键词
内容识别方法
历史评分数据
模型库
文件内容识别
可执行程序代码
格式
表格
模型更新
文本
解析工具
存储器
自然语言
图像
识别模块
处理器
复杂度
分辨率
图文
时间段
系统为您推荐了相关专利信息
RESTful接口
条目
知识集成方法
验证用户身份
HTTP请求
数据信息管理系统
调节系统
信息模块
群智能算法
汽轮机模型
视频
多尺度卷积神经网络
提升系统
序列特征
序列帧