摘要
本申请公开了一种提高召回率的数据搜索方法。在通用信息提取模型的基础上增加一个中间层,中间层用来为通用信息提取模型的输出结果加入逻辑关系,得到信息提取模型的结构。准备并改进训练数据,使训练数据符合人类语言习惯。使用改进后的训练数据来训练所述信息提取模型。使用训练好的所述信息提取模型将用户输入的以自然语言表述的搜索文本转换为带有实体之间逻辑关系的结构化数据的形式,再将带有实体之间逻辑关系的结构化数据拆分为带有逻辑关系的筛选项和搜索词,在搜索引擎中进行搜索。本申请在从自然语言到结构化数据的转换结果中增加了实体之间逻辑关系,从而使这种转换严格遵守用户的原本搜索意图。
技术关键词
信息提取模型
数据搜索方法
实体
搜索词
中间层
生成训练数据
数据搜索装置
自然语言文本
自定义规则
搜索意图
大语言模型
习惯
逻辑
标签
人类
格式
基础
系统为您推荐了相关专利信息
大语言模型
实体间关系
知识图谱查询
摘要
分析方法
输出特征
深层特征提取
雨天
解码单元
浅层特征提取
智能化控制方法
手术室专用
时空轨迹数据
送风单元
热湿负荷