一种基于句法增强的多维向量化文本相似度计算方法

AITNT
正文
推荐专利
一种基于句法增强的多维向量化文本相似度计算方法
申请号:CN202510416311
申请日期:2025-04-03
公开号:CN119918526B
公开日期:2025-07-01
类型:发明专利
摘要
本发明实施例中提供了一种基于句法增强的多维向量化文本相似度计算方法,属于数据处理技术领域,具体包括:步骤1,对输入文本进行分词和句法分析,得到分词结果及其对应的成分标签;步骤2,分别采用WoBERT模型和Transformer的自注意力机制对分词结果进行向量化表示并进行融合,得到融合向量;步骤3,通过深度集成变换器对融合向量进行降维处理,生成具有强表达能力的目标词向量;步骤4,针对相同成分标签的目标词向量,通过义素相似度公式计算相似度值;步骤5,基于全部相似度值,通过加权平均调整最终相似度评分。通过本发明的方案,引入基于句法与词向量结合的文本相似度匹配方法,提高了相似度计算的精度和效率。
技术关键词
分词 条件随机场模型 集成学习策略 度计算方法 集成变换器 文本 标签 注意力机制 深度神经网络架构 词语 列表 预训练模型 数据处理技术 语法结构 编码器 非线性 随机森林 动态 概念 样本
系统为您推荐了相关专利信息
1
考虑参数内在关联的堆石坝坝坡可靠度计算方法
可靠度计算方法 堆石坝 树状结构 皮尔逊相关系数 参数
2
基于人工智能的咨询处理方法、装置、计算机设备及介质
强化学习策略 计算机可读指令 命名实体识别 文本 网络
3
一种智能材料管理系统
材料用量统计 数据管理模块 零件 系统管理模块 基础数据管理
4
一种语音克隆方法、语音克隆装置
克隆方法 文本 音频 语音识别模块 键值
5
一种车辆远程控制方法及系统
车辆远程控制方法 指令模块 仿真模型 匹配模块 车辆远程控制系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号