摘要
本发明公开了一种音频生成方法、装置、设备和存储介质,涉及音频技术领域。该方法包括:响应接收到的文本信息,获取目标用户的历史音频信息,文本信息由目标用户通过目标终端发送;从历史音频信息中提取音色特征;对提取的音色特征进行聚类,以确定聚类中心的音色特征;根据聚类中心的音色特征确定目标用户的当前音色特征;将目标用户的当前音色特征和文本信息输入语音生成模型,以生成具有目标用户的当前音色特征的目标音频。通过本发明实施例的技术方案可以生成个性化语音,从而提高用户体验。
技术关键词
音色特征
音频生成方法
聚类
语音生成模型
文本
计算机可执行指令
生成个性化语音
电子设备
处理器通信
生成装置
标识
终端
模块
存储器
单人
分段
系统为您推荐了相关专利信息
异常信息
异常事件
自定义策略
识别异常数据
监测模块
情感识别模型
情感类别
关键词提取模型
音频特征
人工智能技术