语音识别翻译模型的训练方法、语音识别翻译方法及装置

正文

推荐专利

申请号：CN202510740253

申请日期：2025-06-04

公开号：CN120877719A

公开日期：2025-10-31

类型：发明专利

摘要

本申请实施例提供语音识别翻译模型的训练方法、语音识别翻译方法及装置，涉及大语言模型技术领域。该方法设定三个阶段的训练过程，在第一个阶段用样本量较大的语音识别集合训练语音识别翻译模型的语音识别能力，在第二个阶段，用少量的有监督语音翻译样本进行多模态的机器翻译任务，最后第三个阶段将语音识别和翻译任务进行联合训练，此时语音识别翻译模型在同一个框架内同时进行识别、翻译的操作，减少多阶段处理带来的误差累积，实现高质量的端到端语音识别翻译过程。这种分阶段的课程学习策略，使得语音识别翻译模型能够在数据有限的情况下逐步学习复杂的任务，提高模型的泛化能力，避免因为有监督的数据量不足导致的模型难以收敛的问题。

技术关键词

翻译模型大语言模型语音识别文本语音编码器标签文本翻译方法编码向量样本语音识别训练阶段多模态机器翻译数据获取模块训练装置电子设备参数

系统为您推荐了相关专利信息

基于大语言模型的核电DCS运维信息抽取系统和方法

大语言模型信息抽取系统运维数据信息抽取方法多源异构数据

基于大模型的多模态语义通信方法、系统、设备及介质

语义信道编解码器通信方法投影器多模态

一种基于多智能体的医学影像报告生成方法

报告生成方法影像生成智能强化学习策略大语言模型

一种基于MIP与大语言模型的智能排课方法与装置

教师智能排课方法大语言模型变量唯一性

一种基于检索增强生成的风格化智能对话方法

风格智能对话方法文本大语言模型支持用户自定义

语音识别翻译模型的训练方法、语音识别翻译方法及装置

站点导航

APP 下载