摘要
本申请实施例提供语音识别翻译模型的训练方法、语音识别翻译方法及装置,涉及大语言模型技术领域。该方法设定三个阶段的训练过程,在第一个阶段用样本量较大的语音识别集合训练语音识别翻译模型的语音识别能力,在第二个阶段,用少量的有监督语音翻译样本进行多模态的机器翻译任务,最后第三个阶段将语音识别和翻译任务进行联合训练,此时语音识别翻译模型在同一个框架内同时进行识别、翻译的操作,减少多阶段处理带来的误差累积,实现高质量的端到端语音识别翻译过程。这种分阶段的课程学习策略,使得语音识别翻译模型能够在数据有限的情况下逐步学习复杂的任务,提高模型的泛化能力,避免因为有监督的数据量不足导致的模型难以收敛的问题。
技术关键词
翻译模型
大语言模型
语音识别文本
语音编码器
标签文本
翻译方法
编码向量
样本
语音识别训练
阶段
多模态
机器翻译
数据获取模块
训练装置
电子设备
参数
系统为您推荐了相关专利信息
大语言模型
信息抽取系统
运维
数据信息抽取方法
多源异构数据
报告生成方法
影像
生成智能
强化学习策略
大语言模型
风格
智能对话方法
文本
大语言模型
支持用户自定义