摘要
一种音频处理模型的训练方法、音频处理方法、装置及设备,涉及人工智能技术领域。该方法包括:获取训练数据,训练数据包括至少一个音频数据,以及至少一个音频数据的标签数据;编码音频数据,得到音频模态特征;对音频模态特征降维,得到音频模态降维特征,音频模态降维特征的维度与文本模态特征的维度相匹配;通过音频处理模型的生成网络,基于音频模态降维特征,生成音频数据的音频处理结果,生成网络是基于经过文本模态特征预训练后的大语言模型构建得到的;基于至少一个音频数据的音频处理结果,以及至少一个音频数据的标签数据,调整音频处理模型的参数。本申请实施例能够提高音频处理结果的生成准确性。
技术关键词
降维特征
模态特征
网络
融合特征
标签
编码
音频特征
文本
可读存储介质
参数
数据获取模块
计算机程序产品
生成音频数据
计算机设备
键值
人工智能技术
处理器
系统为您推荐了相关专利信息
贝叶斯概率模型
预警规则
动态时间规整算法
神经网络模型
预警控制方法
Word2Vec模型
字符
长短期记忆网络
密码解码器
度量
多模态特征
运营方法
人工智能服务
强度
机器学习模型
热加工车间
智能决策模型
动态决策方法
航空航天产品
神经网络模型构建
故障智能定位方法
配电系统
傅立叶变换处理
神经网络模型
短路