摘要
本发明提供一种基于大语言模型的中文实体链接方法及系统,涉及自然语言处理技术领域,方法包括:构建知识库并将每个实体转化为实体向量,接收中文输入文本,利用大语言模型识别待链接实体,并生成相应的描述文本;通过召回词实体检索方法,生成第一候选实体集;基于描述文本及向量相似度,生成第二候选实体集;交叉比对两者,若只有一个相同的目标实体,利用BERT模型评分,若评分高于第一预设值,则作为第一实体链接结果;若没有或有多个相同实体,则利用BERT模型对两个候选集进行评分,挑选评分高于第二预设值的多个实体,选择得分最高的实体作为第二实体链接结果;利用大语言模型,过滤实体链接结果中错误的实体链接结果。
技术关键词
中文实体链接方法
大语言模型
文本
BERT模型
计算机可读指令
实体检索方法
实体链接系统
错误实体
编码器
自然语言
处理器
可读存储介质
存储器
机制
程序
系统为您推荐了相关专利信息
电网故障诊断方法
电网告警信息
语义向量
文本
高维特征向量
空闲状态检测方法
音频
对话系统
大语言模型
文本