摘要
本公开提供了一种数据处理方法、装置、电子设备及存储介质,属于人工智能技术领域。针对音效生成场景,本公开能够构建高质量的音效数据用于音效生成模型训练。详细来说,考虑到请求生成音效阶段用户可能存在多种输入形式,本方案引入了数据增强步骤。在数据增强阶段,本方案能够基于请求生成音效阶段用户可能的输入形式,对之前为每段音效数据生成的音效描述文本进行数据增强。由于通过数据增强能够得到内容更加准确的音效描述文本,因此,在请求生成音效阶段,无论用户进行哪种形式的输入,音效生成模型均能够输出适配于用户需求的音效,确保了音效生成模型的生成质量。
技术关键词
数据处理方法
音效生成方法
音频
阶段
电子设备
视频
可执行程序代码
处理器
标签文本
可读存储介质
数据处理装置
人工智能技术
生成场景
关键词
计算机程序产品
时序
系统为您推荐了相关专利信息
原型
多头注意力机制
样本
交叉注意力机制
查询特征
图像数据处理方法
收发模块
切割模块
图像块
指令
链路
网络节点
资源优化方法
建立通信
路径损耗指数
决策树模型
功率
决策树算法
率计算方法
线性插值法