基于RoBERTa-wwm-ext-large预训练模型的中文语义匹配方法

AITNT
正文
推荐专利
基于RoBERTa-wwm-ext-large预训练模型的中文语义匹配方法
申请号:CN202411688518
申请日期:2024-11-25
公开号:CN119538937A
公开日期:2025-02-28
类型:发明专利
摘要
本发明公开了一种基于RoBERTa‑wwm‑ext‑large预训练模型的中文语义匹配方法,所述方法通过预训练模型RoBERTa‑wwm‑ext‑large获取匹配文本的初始向量表示,利用特征注意力加强两个文本向量之间的语义交互;接着将文本向量送入卷积神经网络提取更多特征信息后,再输出到长短期记忆网络这些特征信息的时间序列依赖性,通过自注意力丰富文本向量的上下文信息;建立微调表示模型去处理初始文本连接向量,获得微调过的文本对连接向量。最后将这些文本向量输入到多层感知机网络,计算文本匹配结果。与现有的基于预训练模型的文本匹配算法比较,本发明具有较高的准确度和较好的泛化性。
技术关键词
语义匹配方法 长短期记忆网络 交互结构 多层感知机 文本特征向量 预训练模型 卷积神经网络提取 标签 注意力机制 序列 算法 关系 数据
系统为您推荐了相关专利信息
1
电驱热管理故障控制方法、诊断及调控方法、车辆及云端
寿命预测模型 管理故障 策略 调控方法 云端
2
一种基于多模态数据融合与集成学习的定位方法及系统
多模态数据融合 融合特征 深度神经网络 定位方法 运动轨迹信息
3
一种基于条件流匹配和声码器的语音增强方法和系统
降噪模块 流匹配方法 声码器 多层感知机层 训练神经网络
4
基于数字化企业管理的大数据挖掘方法及系统
策略 文本 多模态会话 数据采集通道 数据挖掘方法
5
一种信息处理方法、装置及电子设备
双向长短期记忆网络 文本 卷积神经网络提取 账户 分类模型构建
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号