摘要
本申请公开了一种搜索联想词生成方法、装置及一种电子设备和计算机可读存储介质,该方法包括:将搜索词集合中的多个搜索词输入训练完成的纠错模型中,得到搜索词对应的纠错词和纠错概率;以纠错词为聚类中心,对同一纠错词对应的搜索词进行聚类;生成搜索词对应的向量表示,根据搜索词的向量表示与搜索词所属类别的聚类中心的向量表示之间的相似度计算搜索词对应的相似度分数;将搜索词对应的纠错概率和相似度分数输入训练完成的判别模型中,以判别搜索词是否属于对应的类别,去除不属于对应的类别的搜索词得到最终的聚类结果;获取目标搜索词,根据最终的聚类结果生成目标搜索词对应的搜索联想词。本申请提高了生成搜索联想词的准确性。
技术关键词
搜索词
搜索联想词
生成方法
纠错
可读存储介质
训练判别模型
机器翻译模型
聚类
电子设备
存储计算机程序
处理器
编码器
存储器
数据