摘要
本发明涉及语音识别及金融科技技术领域,公开了一种定制化音色的语音生成方法、装置、设备及介质,包括:根据初始声音对生成初始语音种群,将初始语音种群中的初始声音与预设的目标文本进行合成,得到合成语音;获取目标用户对合成语音的筛选结果,根据筛选结果对初始语音种群进行突变,得到语音突变种群;将初始语音种群更新为语音突变种群,返回至将初始语音种群中的初始声音对进行合成,得到合成语音步骤,直至生成目标用户对应的目标合成语音;根据性格维度创建目标用户的独特声音,根据独特声音生成目标合成语音的反馈语义;利用反馈语义对目标合成语音进行优化,得到最佳合成语音。本发明可以提升定制化语音合成时的准确性。
技术关键词
语音生成方法
音频特征
语义
文本
客户端
语音特征
金融科技技术
可读存储介质
变异策略
生成语音
处理器
插值算法
生成装置
计算机设备
模块
波形
存储器
数据
系统为您推荐了相关专利信息
知识点
学习路径推荐
负荷
数据优化系统
多模态传感器
步态识别方法
分支
跨模态融合特征
池化特征
模态特征
联邦学习模型
客户端
水印技术
中心服务器
编码器