摘要
本发明提供一种基于人工智能的文献结构化提取方法及系统,旨在解决现有文献处理技术中信息提取不全面、不准确的问题,首先获取包含多个文献单元的原始文献数据集合,并进行预处理得到标准化文献数据集合,接着,调用预训练的文献特征提取模型处理标准化文献数据,提取文献单元的内容特征和结构特征,基于文献单元的内容特征和结构特征,执行结构化解析处理以生成包含主题要素、逻辑关系要素和关键信息要素的结构化要素集合,最后,对结构化要素集合进行整合优化处理,生成包含要素关联关系的最终结构化文献结果,由此实现了文献信息的自动化、结构化提取,提高了文献处理的效率和准确性,为文献的智能化管理和应用提供了新途径。
技术关键词
特征提取模型
文本段落
语义向量
关系
结构特征提取
联合损失函数
条目
数据
层级
逻辑
字符
识别主题
节点
生成主题
符号
存储器
标签