摘要
本申请实施例提供了一种语音合成方法、装置、设备及介质,涉及语音处理技术领域。该方法包括:获取文本信息、交互目标信息和交互场景信息;通过将交互目标信息和交互场景信息输入声音特征量化模型,确定与交互目标信息和交互场景信息对应的声音特征参数集,声音特征参数集包括语速、音量、语调变化和节奏中的至少一种;通过将文本信息和声音特征参数集输入语音合成引擎,合成在交互场景信息下能够达成交互目标信息的语音信号。由此,通过语音合成引擎合成的语音信号,不仅能够准确传达了文本信息,还能根据不同的交互目标和交互场景灵活调整声音特征参数,提高了语音信号在主动影响用户决策过程中的作用。
技术关键词
语音
文本
问答场景
训练机器学习模型
信号
监督学习技术
样本
监测模块
注意力
处理器
参数
介质
存储器
程序
关系
决策
计算机
数据