结合预训练语言模型的跨模态非自回归解码方法及系统

AITNT
正文
推荐专利
结合预训练语言模型的跨模态非自回归解码方法及系统
申请号:CN202510093157
申请日期:2025-01-21
公开号:CN119962548B
公开日期:2025-09-26
类型:发明专利
摘要
结合预训练语言模型的跨模态非自回归解码方法及系统,涉及跨模态翻译。解码系统依次包括目标排列采样、预训练文本编码、预训练文本解码、预训练损失计算、源端特征提取、下游编码、CTC增强、下游解码、下游任务损失计算、输出等模块。解码方法:采样预训练训练样本以及目标排列;将源端文本编码为隐向量;目标端文本解码;预训练阶段损失计算;初始化下游跨模态非自回归翻译模型的参数;源端特征提取;源端特征编码;下游解码模块输入生成;解码模块生成翻译结果;计算下游跨模态非自回归翻译模型损失;下游跨模态非自回归翻译结果输出。利用Random Drop以及CTC,缓解预训练和微调阶段解码器输入的模态差异。
技术关键词
解码模块 预训练语言模型 解码器 编码模块 翻译模型 解码方法 跨模态 文本 特征提取模块 矩阵 生成解码 解码系统 输出模块 线性 注意力 采样模块 训练语料库 阶段
系统为您推荐了相关专利信息
1
一种多模态人脸语义通信方法、设备及介质
人脸语义 人脸特征 通信方法 语义特征 多模态
2
一种基于MTransUnet的细胞图像语义分割方法及系统
双边滤波算法 注意力机制 图像语义分割 网络 易受噪声
3
一种基于改进生成对抗网络的肠镜图像增强方法
肠镜 图像增强模型 图像增强方法 生成对抗网络 编码器
4
基于金字塔可学习带通滤波器的超高清图像去摩尔纹方法
带通滤波器 输出特征 保留图像细节 网络模型训练 跨层特征
5
一种基于Transformer的车辆工况分类方法、产品及设备
样本 分类方法 工况 分类神经网络 车辆
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号