摘要
本申请提供了一种用于实验数据的语义检索方法和装置,涉及文本检索技术领域,该方法为:利用实验原始语料数据,构建文本语料数据集,基于文本语料数据集训练得到预训练语言模型;利用实验原始语料数据中的问答对数据和预训练语言模型,生成问答对语言表示模型,构建语义向量索引;利用问答对语言表示模型,获取问答对数据中每个问句的相关文本,构建文本检索精排模型;将实时文本检索任务中的问句文本输入问句语言表示模型,生成第一问句语义向量表示;利用语义向量索引,进行向量相似度检索,生成与第一问句语义向量表示相关的召回文本集合;将问句文本和召回文本集合输入文本检索精排模型,定位得到答案文本,将答案文本反馈给用户端。
技术关键词
语义向量
预训练语言模型
语义检索方法
问答对数据
语义检索模型
答案
样本
均值算法
倒排索引方式
文本检索技术
标签
信息检索系统
智能问答系统
聚类算法
检索装置
系统为您推荐了相关专利信息
语义图谱
消除噪声干扰
重构误差
跨模态数据
听觉
智能发布方法
关键词
广告资源内容
发布系统
显示终端
动态融合机制
层次注意力
关系抽取方法
多层次特征
三元组