语音识别翻译模型的训练方法、语音识别翻译方法及装置

AITNT
正文
推荐专利
语音识别翻译模型的训练方法、语音识别翻译方法及装置
申请号:CN202510740253
申请日期:2025-06-04
公开号:CN120877719A
公开日期:2025-10-31
类型:发明专利
摘要
本申请实施例提供语音识别翻译模型的训练方法、语音识别翻译方法及装置,涉及大语言模型技术领域。该方法设定三个阶段的训练过程,在第一个阶段用样本量较大的语音识别集合训练语音识别翻译模型的语音识别能力,在第二个阶段,用少量的有监督语音翻译样本进行多模态的机器翻译任务,最后第三个阶段将语音识别和翻译任务进行联合训练,此时语音识别翻译模型在同一个框架内同时进行识别、翻译的操作,减少多阶段处理带来的误差累积,实现高质量的端到端语音识别翻译过程。这种分阶段的课程学习策略,使得语音识别翻译模型能够在数据有限的情况下逐步学习复杂的任务,提高模型的泛化能力,避免因为有监督的数据量不足导致的模型难以收敛的问题。
技术关键词
翻译模型 大语言模型 语音识别文本 语音编码器 标签文本 翻译方法 编码向量 样本 语音识别训练 阶段 多模态 机器翻译 数据获取模块 训练装置 电子设备 参数
系统为您推荐了相关专利信息
1
基于大语言模型的核电DCS运维信息抽取系统和方法
大语言模型 信息抽取系统 运维 数据信息抽取方法 多源异构数据
2
基于大模型的多模态语义通信方法、系统、设备及介质
语义 信道编解码器 通信方法 投影器 多模态
3
一种基于多智能体的医学影像报告生成方法
报告生成方法 影像 生成智能 强化学习策略 大语言模型
4
一种基于MIP与大语言模型的智能排课方法与装置
教师 智能排课方法 大语言模型 变量 唯一性
5
一种基于检索增强生成的风格化智能对话方法
风格 智能对话方法 文本 大语言模型 支持用户自定义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号