一种基于句法增强的多维向量化文本相似度计算方法

正文

推荐专利

申请号：CN202510416311

申请日期：2025-04-03

公开号：CN119918526B

公开日期：2025-07-01

类型：发明专利

摘要

本发明实施例中提供了一种基于句法增强的多维向量化文本相似度计算方法，属于数据处理技术领域，具体包括：步骤1，对输入文本进行分词和句法分析，得到分词结果及其对应的成分标签；步骤2，分别采用WoBERT模型和Transformer的自注意力机制对分词结果进行向量化表示并进行融合，得到融合向量；步骤3，通过深度集成变换器对融合向量进行降维处理，生成具有强表达能力的目标词向量；步骤4，针对相同成分标签的目标词向量，通过义素相似度公式计算相似度值；步骤5，基于全部相似度值，通过加权平均调整最终相似度评分。通过本发明的方案，引入基于句法与词向量结合的文本相似度匹配方法，提高了相似度计算的精度和效率。

技术关键词

分词条件随机场模型集成学习策略度计算方法集成变换器文本标签注意力机制深度神经网络架构词语列表预训练模型数据处理技术语法结构编码器非线性随机森林动态概念样本

系统为您推荐了相关专利信息

考虑参数内在关联的堆石坝坝坡可靠度计算方法

可靠度计算方法堆石坝树状结构皮尔逊相关系数参数

基于人工智能的咨询处理方法、装置、计算机设备及介质

强化学习策略计算机可读指令命名实体识别文本网络

一种智能材料管理系统

材料用量统计数据管理模块零件系统管理模块基础数据管理

一种语音克隆方法、语音克隆装置

克隆方法文本音频语音识别模块键值

一种车辆远程控制方法及系统

车辆远程控制方法指令模块仿真模型匹配模块车辆远程控制系统

一种基于句法增强的多维向量化文本相似度计算方法

站点导航

APP 下载