文本检索匹配方法、装置、存储介质和计算机程序产品

正文

推荐专利

申请号：CN202410925785

申请日期：2024-07-10

公开号：CN118939754A

公开日期：2024-11-12

类型：发明专利

摘要

本申请公开了一种文本检索匹配方法、装置、存储介质和计算机程序产品。其中，该方法包括：获取第一搜索请求文本，并提取第一搜索请求文本的主题词；从预设的数据库内多个文本内获取与主题词相同的至少一个备选文本；利用预设的目标语言模型对第一搜索请求文本和各个备选文本进行特征提取，得到第一搜索请求文本对应的第一嵌入式表征向量和各个备选文本对应的第二嵌入式表征向量；确定第一嵌入式表征向量和各个第二嵌入式表征向量之间的向量相似度，并从至少一个备选文本内确定向量相似度不低于预设的向量相似度阈值的目标文本。本申请解决了采用人工标注的有标签数据所训练的模型在文本量较大的检索匹配场景下的性能较差的技术问题。

技术关键词

文本样本梯度下降算法非易失性存储介质数据分词计算机程序产品特征提取模块参数洗牌传播算法标签处理器场景

文本检索匹配方法、装置、存储介质和计算机程序产品

站点导航

APP 下载