一种有效跨模态表征对齐与融合语音翻译方法

正文

推荐专利

申请号：CN202510649638

申请日期：2025-05-20

公开号：CN120562430A

公开日期：2025-08-29

类型：发明专利

摘要

本发明涉及一种有效跨模态表征对齐与融合语音翻译方法，属于语音翻译技术领域。本发明包括步骤：构建包括文本嵌入模块、翻译编码器、翻译解码器的文本翻译预训练模块；通过文本嵌入模块将源语言和目标语言的文本输入投影到高维空间；通过翻译编码器得到文本表征；通过翻译解码器将文本表征进行解码；构建语音编码器模块，提取语音的语义表征，再使用动态加权长度适配器提取最终的语音表征；构建表征融合模块，将语音表征和文本表征进行融合，在语音表征和文本表征融合的基础上使用自注意力模块使得模型能够关注更加关键的信息；最小化目标语言的翻译损失，完成语音翻译模型的预训练，用训练好的模型进行语音翻译。本发明提升了语音翻译性能。

技术关键词

语音翻译方法文本语音编码器跨模态翻译模型模块序列语音特征注意力机制适配器语义特征提取编解码器语音翻译技术语音翻译系统高维数据空间机器翻译

系统为您推荐了相关专利信息

一种基于深度学习的跨源数据质量缺陷检测方法及系统

数据缺陷检测方法前馈神经网络预训练语言模型编码器

数据库知识体的构建方法及结构化查询语言生成方法

关系型数据库字段结构化查询语言大语言模型文本

一种汽车分期贷款逾期率的数据预测方法及系统

数据预测方法文本标签报告情感分类模型

关联规则与智能体的大数据聚集性隐患判别方法及系统

Apriori算法面向电力设备判别方法连续监测数据判别系统

数据的标签添加方法、装置、电子设备及计算机程序产品

标签数据语义样本计算机程序产品

一种有效跨模态表征对齐与融合语音翻译方法

站点导航

APP 下载