一种语音大模型训练与推理架构优化方法

正文

推荐专利

一种语音大模型训练与推理架构优化方法

申请号：CN202510623449

申请日期：2025-05-15

公开号：CN120496497A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了一种语音大模型训练与推理架构优化方法，包括以下步骤：在训练过程中采用自回归的方式进行生成，在第一阶段，模型采用传统的教师强制方式进行训练：以完整的文本提示和语音提示作为输入，生成第一轮预测序列；进入后续阶段后，模型逐步将自身生成的预测结果与原始的ground‑truth提示混合，用作下一阶段的伪标签提示，该混合过程通过逐token采样的方式迭代进行。本发明提供了一种语音大模型训练与推理架构优化方法，可以通提升训练过程的效率，并减轻过拟合的风险；提升模型生成语音的质量和一致性，提升生成效果和训练效率。

技术关键词

推理架构生成语音强化学习算法文本教师机制框架策略标签多阶段序列解码决策逻辑场景动态风险基础

系统为您推荐了相关专利信息

一种类别可动态扩展的层次化主题分类持续训练方法

标签结构主题神经网络模型数据动态

基于音频的特效生成方法、装置、设备以及存储介质

特效生成方法控制策略音频特征文本特效生成装置

一种联邦半监督学习方法及装置

半监督学习方法客户端中心服务器教师学生

基于预训练大模型的零样本图像属性标注方法

大语言模型标注方法零样本图像分类图像嵌入转化方法

一种基于人工智能驱动的情感分析系统及方法

人工智能驱动情感分析系统关键词文本情感分析方法

一种语音大模型训练与推理架构优化方法

站点导航

APP 下载