摘要
本发明涉及一种索引与表征模型的联合优化方法、系统及可读存储介质,方法包括:获取若干个查询语句与对应查询文档形成的数据对集合,标注不同相关性层级的标签并存储在结构化数据库中;随机选取若干个数据对,利用表征模型对数据对进行编码得到对应的查询语句向量和查询文档向量;对向量进行乘积量化处理并存储在向量数据库中;从向量数据库中随机选取查询压缩向量,并根据标签采用多级负例采样策略选出对应的若干个文档压缩向量作为负例文档向量;计算查询压缩向量与对应的各个负例文档向量的相似度得分并构建损失函数;通过反向传播更新表征模型的参数以及聚类中心。本发明能够减少查询时的计算冗余,提升查询效率与响应速度。
技术关键词
联合优化方法
初始聚类中心
语句
索引
聚类算法
数据
标签
策略
层级
采样模块
编码模块
可读存储介质
参数
动态
冗余
系统为您推荐了相关专利信息
文本特征向量
语音特征参数
文本数据提取
风险评估方法
词语