摘要
本申请公开了一种文本检索匹配方法、装置、存储介质和计算机程序产品。其中,该方法包括:获取第一搜索请求文本,并提取第一搜索请求文本的主题词;从预设的数据库内多个文本内获取与主题词相同的至少一个备选文本;利用预设的目标语言模型对第一搜索请求文本和各个备选文本进行特征提取,得到第一搜索请求文本对应的第一嵌入式表征向量和各个备选文本对应的第二嵌入式表征向量;确定第一嵌入式表征向量和各个第二嵌入式表征向量之间的向量相似度,并从至少一个备选文本内确定向量相似度不低于预设的向量相似度阈值的目标文本。本申请解决了采用人工标注的有标签数据所训练的模型在文本量较大的检索匹配场景下的性能较差的技术问题。
技术关键词
文本
样本
梯度下降算法
非易失性存储介质
数据
分词
计算机程序产品
特征提取模块
参数
洗牌
传播算法
标签
处理器
场景