摘要
本申请提供了一种基于领域知识图谱及卫星影像的短文本语义增强方法,包括:使用大语言模型对短文本中的实体及类型进行辅助标注;采用多路召回及重排手段,从领域知识图谱中检索与短文本关联的领域知识图谱三元组,并将语句化后的三元组作为短文本实体识别中的实体知识;判断原始语料的短文本中是否包含附带卫星影像:若原始语料的短文本中附带卫星影像时,直接使用附带卫星影像;否则,在卫星影像库中搜索与短文本关联的卫星影像,作为短文本实体识别的背景知识;分别对三元组及卫星影像进行语句化处理,以统一输入形式,得到语义增强后文本;利用实体知识和背景知识对语义增强后文本进行实体标注,给出真实实体标签,得到标注后语料。
技术关键词
三元组
影像
实体
图谱
语句
双向长短期记忆网络
文本
大语言模型
预训练语言模型
训练集
条件随机场
超参数
关键词
语义特征
关系
标签
分词
布局
系统为您推荐了相关专利信息
风险预测模型
轻度认知障碍
血管性认知障碍
阿尔茨海默病患者
训练特征
节点
融合语义
大语言模型
智能合约漏洞
语义向量
混凝土重力坝
生成三维模型
石料
影像
三维激光扫描技术