摘要
本发明涉及人工智能技术领域,具体提供一种文本相似度识别方法、系统、设备及存储介质,包括:对文本进行分词处理,并将分词后的文本单元转换为整数索引;通过预训练语义识别模型的嵌入矩阵,将每个整数索引转换为对应的嵌入向量,并将同一文本的嵌入向量保存至同一向量集合;计算不同向量集合的向量的欧式距离,并利用注意力矩阵基于所述欧式距离计算加权相似度。本发明通过将文本转换为高维向量,充分理解文本的上下文语义信息和深层含义,然后通过注意力权重计算向量之间的相似度,从而提升了文本相似度识别的准确度。
技术关键词
文本
度识别方法
矩阵
注意力
索引
分词
位置编码信息
BERT模型
上下文语义信息
位置编码单元
可读存储介质
人工智能技术
识别系统
转换单元
程序
识别模块
分析模块
处理单元
系统为您推荐了相关专利信息
物联网入侵检测方法
智慧海洋
入侵检测模型
样本
服务器
问诊方法
图像特征向量
医疗专业
算法模型
适配器
超声心动图
视频分类方法
特征提取模块
特征加权融合
关键帧