一种有效跨模态表征对齐与融合语音翻译方法

AITNT
正文
推荐专利
一种有效跨模态表征对齐与融合语音翻译方法
申请号:CN202510649638
申请日期:2025-05-20
公开号:CN120562430A
公开日期:2025-08-29
类型:发明专利
摘要
本发明涉及一种有效跨模态表征对齐与融合语音翻译方法,属于语音翻译技术领域。本发明包括步骤:构建包括文本嵌入模块、翻译编码器、翻译解码器的文本翻译预训练模块;通过文本嵌入模块将源语言和目标语言的文本输入投影到高维空间;通过翻译编码器得到文本表征;通过翻译解码器将文本表征进行解码;构建语音编码器模块,提取语音的语义表征,再使用动态加权长度适配器提取最终的语音表征;构建表征融合模块,将语音表征和文本表征进行融合,在语音表征和文本表征融合的基础上使用自注意力模块使得模型能够关注更加关键的信息;最小化目标语言的翻译损失,完成语音翻译模型的预训练,用训练好的模型进行语音翻译。本发明提升了语音翻译性能。
技术关键词
语音翻译方法 文本 语音编码器 跨模态 翻译模型 模块 序列 语音特征 注意力机制 适配器 语义特征提取 编解码器 语音翻译技术 语音翻译系统 高维数据空间 机器翻译
系统为您推荐了相关专利信息
1
一种基于深度学习的跨源数据质量缺陷检测方法及系统
数据 缺陷检测方法 前馈神经网络 预训练语言模型 编码器
2
数据库知识体的构建方法及结构化查询语言生成方法
关系型数据库 字段 结构化查询语言 大语言模型 文本
3
一种汽车分期贷款逾期率的数据预测方法及系统
数据预测方法 文本 标签 报告 情感分类模型
4
关联规则与智能体的大数据聚集性隐患判别方法及系统
Apriori算法 面向电力设备 判别方法 连续监测数据 判别系统
5
数据的标签添加方法、装置、电子设备及计算机程序产品
标签 数据 语义 样本 计算机程序产品
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号