摘要
本发明公开了一种基于相似度检索的文本召回系统及方法,S1、接收用户输入的查询文本;S2、对于短文本提取短文本语义特征向量,对于长文本提取长文本语义特征向量;S3、构建初始向量拓扑结构;S4、在向量库系统中采用改进神经拓扑优化算法对初始向量拓扑结构分别进行动态调整;S5、基于优化后的向量拓扑结构生成每个短文本和长文本的局部拓扑特征表示;S6、确定查询请求文本的潜在关联分片;S7、对查询请求文本进行排序;S8、将排序结果中相似度最高的若干查询请求文本返回作为检索结果输出。本发明显著提高了文本召回的效率和精准度。
技术关键词
召回方法
分片
拓扑特征
特征提取模型
文本特征向量
关系
语义特征
邻域
动态
特征提取模块
语义向量
定义
分层
输出模块
算法
周期性
字符