基于RoBERTa-wwm-ext-large预训练模型的中文语义匹配方法

正文

推荐专利

申请号：CN202411688518

申请日期：2024-11-25

公开号：CN119538937A

公开日期：2025-02-28

类型：发明专利

摘要

本发明公开了一种基于RoBERTa‑wwm‑ext‑large预训练模型的中文语义匹配方法，所述方法通过预训练模型RoBERTa‑wwm‑ext‑large获取匹配文本的初始向量表示，利用特征注意力加强两个文本向量之间的语义交互；接着将文本向量送入卷积神经网络提取更多特征信息后，再输出到长短期记忆网络这些特征信息的时间序列依赖性，通过自注意力丰富文本向量的上下文信息；建立微调表示模型去处理初始文本连接向量，获得微调过的文本对连接向量。最后将这些文本向量输入到多层感知机网络，计算文本匹配结果。与现有的基于预训练模型的文本匹配算法比较，本发明具有较高的准确度和较好的泛化性。

技术关键词

语义匹配方法长短期记忆网络交互结构多层感知机文本特征向量预训练模型卷积神经网络提取标签注意力机制序列算法关系数据

系统为您推荐了相关专利信息

电驱热管理故障控制方法、诊断及调控方法、车辆及云端

寿命预测模型管理故障策略调控方法云端

一种基于多模态数据融合与集成学习的定位方法及系统

多模态数据融合融合特征深度神经网络定位方法运动轨迹信息

一种基于条件流匹配和声码器的语音增强方法和系统

降噪模块流匹配方法声码器多层感知机层训练神经网络

基于数字化企业管理的大数据挖掘方法及系统

策略文本多模态会话数据采集通道数据挖掘方法

一种信息处理方法、装置及电子设备

双向长短期记忆网络文本卷积神经网络提取账户分类模型构建

基于RoBERTa-wwm-ext-large预训练模型的中文语义匹配方法

站点导航

APP 下载