文本相似度识别方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202411832199

申请日期：2024-12-12

公开号：CN120012777A

公开日期：2025-05-16

类型：发明专利

摘要

本发明涉及人工智能技术领域，具体提供一种文本相似度识别方法、系统、设备及存储介质，包括：对文本进行分词处理，并将分词后的文本单元转换为整数索引；通过预训练语义识别模型的嵌入矩阵，将每个整数索引转换为对应的嵌入向量，并将同一文本的嵌入向量保存至同一向量集合；计算不同向量集合的向量的欧式距离，并利用注意力矩阵基于所述欧式距离计算加权相似度。本发明通过将文本转换为高维向量，充分理解文本的上下文语义信息和深层含义，然后通过注意力权重计算向量之间的相似度，从而提升了文本相似度识别的准确度。

技术关键词

文本度识别方法矩阵注意力索引分词位置编码信息 BERT模型上下文语义信息位置编码单元可读存储介质人工智能技术识别系统转换单元程序识别模块分析模块处理单元

系统为您推荐了相关专利信息

一种基于多模态数据的广告类案推荐系统及方法

广告实体知识图谱构建关键点类案推荐方法

一种基于联邦学习和深度学习的智慧海洋物联网入侵检测方法

物联网入侵检测方法智慧海洋入侵检测模型样本服务器

一种融合医学影像与医学文本的多模态医疗AI辅助问诊方法

问诊方法图像特征向量医疗专业算法模型适配器

基于熵值的无人机飞行参数预测可靠性评估方法

可靠性评估方法矩阵无人机飞行参数数据序列

一种超声心动图视频分类方法、系统及终端

超声心动图视频分类方法特征提取模块特征加权融合关键帧

文本相似度识别方法、系统、设备及存储介质

站点导航

APP 下载