面向短文本实体消歧的多因素文本特性融合的候选实体二级筛选方法

AITNT
正文
推荐专利
面向短文本实体消歧的多因素文本特性融合的候选实体二级筛选方法
申请号:CN202511117668
申请日期:2025-08-11
公开号:CN121009969A
公开日期:2025-11-25
类型:发明专利
摘要
本发明涉及面向短文本实体消歧的多因素文本特性融合的候选实体二级筛选方法,属于实体消歧领域。本发明根据短文本实体消歧的实际应用需求,为进一步精简候选实体规模,将候选实体筛选分为粗化筛选和细化筛选两个阶段。首先,在粗化筛选阶段,利用维基百科知识库,考虑上下文局部匹配度以及实体关联度等指标,对候选实体进行初步筛选。其次,在细化筛选阶段,提出多维特征度量的关键词提取方法,并引入先验信息计算候选实体与实体指称的相似度,通过候选实体的综合相似性评分完成候选实体的细化筛选。
技术关键词
筛选方法 关键词提取方法 语义 维基百科 信息熵理论 文本 度量 实体消歧 关键词提取算法 高维向量空间 大规模语料 词向量模型 机制 句法结构 频率估计 信息检索
系统为您推荐了相关专利信息
1
基于通信主题识别的业务响应方法、装置、设备及介质
业务响应方法 词语 内容分类 业务信息系统 文本
2
一种车辆信号的显示方法及装置、电子设备和存储介质
车辆 可视化图表 信号值 数据格式 横轴
3
一种基于知识图谱的中医电子病历智能分类方法及系统
实体 电子病历 智能分类方法 图谱 智能分类系统
4
一种基于边界线索深度融合的息肉图像分割方法
深度特征融合 图像分割模型 图像分割方法 线索 融合特征
5
文本匹配模型的训练方法、文本匹配方法及其装置
语义 鲁棒性 生成训练样本 训练样本集 文本匹配方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号