摘要
本发明实施例中提供了一种基于句法增强的多维向量化文本相似度计算方法,属于数据处理技术领域,具体包括:步骤1,对输入文本进行分词和句法分析,得到分词结果及其对应的成分标签;步骤2,分别采用WoBERT模型和Transformer的自注意力机制对分词结果进行向量化表示并进行融合,得到融合向量;步骤3,通过深度集成变换器对融合向量进行降维处理,生成具有强表达能力的目标词向量;步骤4,针对相同成分标签的目标词向量,通过义素相似度公式计算相似度值;步骤5,基于全部相似度值,通过加权平均调整最终相似度评分。通过本发明的方案,引入基于句法与词向量结合的文本相似度匹配方法,提高了相似度计算的精度和效率。
技术关键词
分词
条件随机场模型
集成学习策略
度计算方法
集成变换器
文本
标签
注意力机制
深度神经网络架构
词语
列表
预训练模型
数据处理技术
语法结构
编码器
非线性
随机森林
动态
概念
样本
系统为您推荐了相关专利信息
可靠度计算方法
堆石坝
树状结构
皮尔逊相关系数
参数
强化学习策略
计算机可读指令
命名实体识别
文本
网络
材料用量统计
数据管理模块
零件
系统管理模块
基础数据管理
车辆远程控制方法
指令模块
仿真模型
匹配模块
车辆远程控制系统