摘要
本发明公开了一种基于RoBERTa‑wwm‑ext‑large预训练模型的中文语义匹配方法,所述方法通过预训练模型RoBERTa‑wwm‑ext‑large获取匹配文本的初始向量表示,利用特征注意力加强两个文本向量之间的语义交互;接着将文本向量送入卷积神经网络提取更多特征信息后,再输出到长短期记忆网络这些特征信息的时间序列依赖性,通过自注意力丰富文本向量的上下文信息;建立微调表示模型去处理初始文本连接向量,获得微调过的文本对连接向量。最后将这些文本向量输入到多层感知机网络,计算文本匹配结果。与现有的基于预训练模型的文本匹配算法比较,本发明具有较高的准确度和较好的泛化性。
技术关键词
语义匹配方法
长短期记忆网络
交互结构
多层感知机
文本特征向量
预训练模型
卷积神经网络提取
标签
注意力机制
序列
算法
关系
数据
系统为您推荐了相关专利信息
多模态数据融合
融合特征
深度神经网络
定位方法
运动轨迹信息
降噪模块
流匹配方法
声码器
多层感知机层
训练神经网络
策略
文本
多模态会话
数据采集通道
数据挖掘方法
双向长短期记忆网络
文本
卷积神经网络提取
账户
分类模型构建