一种多语言即时语音翻译模型的训练方法及翻译方法

正文

推荐专利

申请号：CN202510811452

申请日期：2025-06-17

公开号：CN120673749A

公开日期：2025-09-19

类型：发明专利

摘要

本申请涉及多模态学习技术领域，尤其涉及一种多语言即时语音翻译模型的训练方法及翻译方法，该训练方法包括：从音频语料中提取出语音特征，以及，从音频语料对应的文本语料中提取出文本特征；将同一语言中表示同一语义的语音特征及文本特征进行特征融合，得到与各个语义对应的融合特征；分别将融合特征映射至同一预设语义空间，得到每一融合特征对应的多模态特征；以多模态特征为训练数据，对预设多模态基础模型进行训练，得到多语言即时语音翻译模型这样，能够将语音、文本等多种输入形式整合到一个统一的模型架构中，以使模型可以处理多种语言之间的翻译任务。

技术关键词

翻译模型文本多语言知识库构建方法音频语音特征翻译方法语言知识库融合特征语义大语言模型条目多模态特征处理器日志关系程序

一种多语言即时语音翻译模型的训练方法及翻译方法

站点导航

APP 下载