摘要
本发明公开了一种基于TF‑IDF拼音向量模型的智能电话本搜索方法,属于通信领域;具体为:首先,将通信设备的联系人姓名进行拼音转换得到字符串,计算每个字符的IDF值;并计算每个字符的词频TF值,进一步得到TF‑IDF值,并进行归一化处理;当用户输入待查询的联系人M信息,得到归一化后的TF‑IDF向量后,计算联系人M的TF‑IDF向量与保存的各联系人TF‑IDF向量的余弦相似度;遍历保存的各联系人,分别计算联系人M和各联系人的姓名中文名称与拼音的标准化编辑距离,并从中选取最大值作为最终编辑距离相似度;通过余弦相似度和最终编辑距离相似度加权构造联系人M和各联系人的相似度评分;并降序排序;筛选出前K个作为搜索结果展示给用户。本发明实现了搜索精度的显著提升。
技术关键词
拼音
搜索方法
字符
编辑
索引表
嵌入式通信设备
词频统计
元素
格式
矩阵
邮箱
字母
算法
频率
精度
系统为您推荐了相关专利信息
组合特征向量
顶级域
分块
BERT模型
统计特征
协同导航算法
惯性导航系统
性能优化方法
坐标系
时延
深度学习优化
加密方法
任务调度系统
彩虹表
加密算法