摘要
本发明公开了一种声音输出方法、装置、可读介质及电子设备,属于人工智能技术领域,具体包括以下步骤:获取基全部训练用语音文件数据集,所述全部训练用语音文件数据集包括基础情绪语音文件数据集和多个情感语音文件数据集,对基础情绪语音文件数据集和多个情感语音文件数据集各自标记以进行区分;通过机器学习方法获取全部训练用语音文件数据集任一相邻音素组合之间各音素的时长和频率;通过F0曲线分析得到每个情感语音文件数据集和基础情绪语音文件数据集之间任一两个数据集之间,任一相邻音素组合之间各音素的时长和频率的差值;指定输出的情感,输入文字,即输出得到具有指定情感表现的语音,有效的提升了用户的体验。
技术关键词
声音输出方法
语音生成模型
数据
语音生成方法
基础
频率
习惯
机器学习方法
声音输出装置
自然语言
统计学方法
电子设备
曲线
深度学习模型
存储计算机程序
人工智能技术
标记
输入模块
系统为您推荐了相关专利信息
知识抽取方法
命名实体识别
企业
实体命名识别
语句
状态监测方法
音频
融合特征
文本
交叉注意力机制