音频处理模型的训练方法、音频处理方法、装置及设备

正文

推荐专利

申请号：CN202510849623

申请日期：2025-06-24

公开号：CN120656445A

公开日期：2025-09-16

类型：发明专利

摘要

一种音频处理模型的训练方法、音频处理方法、装置及设备，涉及人工智能技术领域。该方法包括：获取训练数据，训练数据包括至少一个音频数据，以及至少一个音频数据的标签数据；编码音频数据，得到音频模态特征；对音频模态特征降维，得到音频模态降维特征，音频模态降维特征的维度与文本模态特征的维度相匹配；通过音频处理模型的生成网络，基于音频模态降维特征，生成音频数据的音频处理结果，生成网络是基于经过文本模态特征预训练后的大语言模型构建得到的；基于至少一个音频数据的音频处理结果，以及至少一个音频数据的标签数据，调整音频处理模型的参数。本申请实施例能够提高音频处理结果的生成准确性。

技术关键词

降维特征模态特征网络融合特征标签编码音频特征文本可读存储介质参数数据获取模块计算机程序产品生成音频数据计算机设备键值人工智能技术处理器

系统为您推荐了相关专利信息

一种防止胎侧耐磨胶打折的预警控制方法及系统

贝叶斯概率模型预警规则动态时间规整算法神经网络模型预警控制方法

基于上下文的深度邮件密码强度度量方法

Word2Vec模型字符长短期记忆网络密码解码器度量

网点运营方法、装置、设备、介质和程序产品

多模态特征运营方法人工智能服务强度机器学习模型

航空航天产品热加工车间动态决策方法、装置及设备

热加工车间智能决策模型动态决策方法航空航天产品神经网络模型构建

一种配电系统短路故障智能定位方法、系统及介质

故障智能定位方法配电系统傅立叶变换处理神经网络模型短路

音频处理模型的训练方法、音频处理方法、装置及设备

站点导航

APP 下载