音频处理模型的训练方法、音频处理方法、装置及设备

AITNT
正文
推荐专利
音频处理模型的训练方法、音频处理方法、装置及设备
申请号:CN202510849623
申请日期:2025-06-24
公开号:CN120656445A
公开日期:2025-09-16
类型:发明专利
摘要
一种音频处理模型的训练方法、音频处理方法、装置及设备,涉及人工智能技术领域。该方法包括:获取训练数据,训练数据包括至少一个音频数据,以及至少一个音频数据的标签数据;编码音频数据,得到音频模态特征;对音频模态特征降维,得到音频模态降维特征,音频模态降维特征的维度与文本模态特征的维度相匹配;通过音频处理模型的生成网络,基于音频模态降维特征,生成音频数据的音频处理结果,生成网络是基于经过文本模态特征预训练后的大语言模型构建得到的;基于至少一个音频数据的音频处理结果,以及至少一个音频数据的标签数据,调整音频处理模型的参数。本申请实施例能够提高音频处理结果的生成准确性。
技术关键词
降维特征 模态特征 网络 融合特征 标签 编码 音频特征 文本 可读存储介质 参数 数据获取模块 计算机程序产品 生成音频数据 计算机设备 键值 人工智能技术 处理器
系统为您推荐了相关专利信息
1
一种防止胎侧耐磨胶打折的预警控制方法及系统
贝叶斯概率模型 预警规则 动态时间规整算法 神经网络模型 预警控制方法
2
基于上下文的深度邮件密码强度度量方法
Word2Vec模型 字符 长短期记忆网络 密码解码器 度量
3
网点运营方法、装置、设备、介质和程序产品
多模态特征 运营方法 人工智能服务 强度 机器学习模型
4
航空航天产品热加工车间动态决策方法、装置及设备
热加工车间 智能决策模型 动态决策方法 航空航天产品 神经网络模型构建
5
一种配电系统短路故障智能定位方法、系统及介质
故障智能定位方法 配电系统 傅立叶变换处理 神经网络模型 短路
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号