摘要
本申请实施例提供了一种模型训练方法、音频生成方法、水印检测方法及装置,涉及数据处理技术领域,该模型训练方法包括:获取样本对;将样本文本输入至待训练的文本到语音生成模型,得到样本文本对应的音频输出结果;将样本文本对应的音频输出结果转换为频谱图,得到样本文本对应的待利用频谱图;基于样本音频和样本文本对应的音频输出结果的差异,以及样本频谱图和样本文本对应的待利用频谱图的差异,确定目标模型损失;响应于根据目标模型损失判定文本到语音生成模型未收敛,对文本到语音生成模型进行参数调整。通过本申请所训练的文本到语音生成模型能够生成添加随机水印的音频,以便有效识别音频的归属。
技术关键词
语音生成模型
音频生成方法
文本
样本
水印检测方法
模型训练方法
图像
网络
水印检测装置
频率
模型训练装置
输入模块
可读存储介质
数据处理技术
生成装置
参数
系统为您推荐了相关专利信息
大数据画像
多源异构数据
随机森林
样本
防控方法
GNSS欺骗干扰检测
基带信号处理模块
人工神经网络
中频信号
生成训练数据
音乐推荐方法
特征时间点
患者
数值
人体面部图像
局部邻域标准化
故障检测方法
样本
数据
成分分析
路线优化方法
振动特征
序列
地图矢量数据
分布特征