摘要
本发明提供一种基于大模型的长文本信息抽取与关联分析方法及系统,涉及自然语言处理技术领域,包括基于语义密度值确定滑动窗口参数对长文本分块,提取文本块特征向量并计算语义相关度,构建层次聚类特征矩阵合并文本块得到语义片段。之后,对语义片段进行句法分析构建语义依存树,提取语义网络并计算实体关系强度值构建语义关联图。最后,利用预训练大模型提取节点特征,通过层次注意力机制融合语义表示,采用自适应图网络传播增强特征,并通过分层决策网络生成候选路径,选择最优路径并输出关联路径及概率分布。本发明能够有效地从长文本中提取关键信息并分析实体间的关联关系,提高信息抽取的准确性和效率。
技术关键词
语义向量
文本
语义相关度
词语
实体
聚类特征
节点特征
语义依存树
上下文特征
网络
滑动窗口
关联分析方法
层次注意力机制
多头注意力机制
编码向量
密度分布矩阵