摘要
本发明提供了一种文档智能处理与知识库构建方法,该方法包括:接收多模态文档并进行布局分析,划分为若干内容区域;采用AI模型为各区域生成语义标签;基于语义标签,通过一个融合了业务优先级和预估资源消耗量的动态调度算法,智能选择并调度处理模型提取区域内容,获得原始数据;利用AI模型对原始数据进行上下文语义校验、修正与归一化,生成结构化的实体数据,并析出实体间的语义关联关系;最终基于实体与关联构建可溯源的领域知识库。本发明解决了多模态文档处理中资源分配不均、内容理解不深、知识化程度低的问题,从而实现了自动化知识库的构建。
技术关键词
资源消耗量
知识库构建方法
语义标签
人工智能模型
动态调度算法
实体
图像边缘特征
多模态
队列
可读存储介质
分布特征
资源分配
计算机
度函数
表格
符号
布局
程序
文本