地址相似度计算方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202410719381

申请日期：2024-06-05

公开号：CN118296405B

公开日期：2024-11-05

类型：发明专利

摘要

本发明公开了一种地址相似度计算方法、装置及存储介质，方法包括：利用BERT模型，从多字段地址数据中提取出语料特征，并转化为结构化标准地址的文本特征向量；根据不同字段在地址中的重要程度以及BERT模型训练中的特征表现，为各字段设定相应的权值，以便在相似度计算阶段综合考虑各部分的影响；根据文本特征向量利用余弦相似度方法计算中文文本以及其对应拼音的相似度，以双维度衡量地址间的相似性；基于中文文本以及其对应拼音的相似度，确定多字段文本的综合相似度，并设定阈值判断两个多字段文本是否相似；本发明方法不仅提升了在面对多字段地址匹配任务时的成功率，而且有效地解决了长文本中有效地址提取准确率低的问题。

技术关键词

文本特征向量 BERT模型度计算方法中文文本拼音动态更新关键词语义特征数据模块处理器关系字符可读存储介质格式存储器计算机噪声样本

系统为您推荐了相关专利信息

答案获取方法及相关设备

答案获取方法语句语义关联度解码器 SQL模板

融入新型对抗策略和强化特征提取的文本情感分类方法

文本情感分类方法局部注意力机制对抗性更新模型参数策略

一种中文文本难度分类方法、系统及存储介质

中文文本分类方法指标分词矩阵

一种基于多层架构的中小型企业信息管理方法及系统

企业信息管理方法动态规则引擎行业知识图谱容器管理平台逻辑

相框数字人的智能交互方法及系统

智能交互方法 Dijkstra算法记忆模型生成自然语言情感分析模型

地址相似度计算方法、装置、设备及存储介质

站点导航

APP 下载