一种基于表达感知最近邻的信息抽取方法

正文

推荐专利

一种基于表达感知最近邻的信息抽取方法

申请号：CN202410808838

申请日期：2024-06-21

公开号：CN118861281A

公开日期：2024-10-29

类型：发明专利

摘要

本发明提供了一种基于表达感知最近邻的信息抽取方法，通过引入后交互最近邻算法，将检索词和文本词均映射入向量空间计算，将信息抽取转换为向量检索问题，提高信息抽取的可扩展性、可适应性以及可解释性。在训练阶段，构建了统一的索引结构，结合表达方式相似度计算和几何分布策略进行采样，并使用了类别不平衡损失函数，保证训练过程各个训练实例具有相对一致的优化方向，提高了可扩展性和可适应性；在非训练阶段，通过结合推理阶段检索到的标注样例和LIME算法，本发明可以对抽取的信息实例进行合理解释，提高了可解释性。

技术关键词

元素信息抽取方法编码器索引自然语言文本标识符标记上下文特征分词参数样本算法邻域控制权字段阶段实体关系

一种基于表达感知最近邻的信息抽取方法

站点导航

APP 下载