摘要
本申请实施例提供了一种语音答复方法和装置、电子设备及存储介质,属于人工智能技术领域,适用于医疗技术领域和金融科技领域。该方法包括:获取样本文本;通过预设的初始语音合成模型对样本文本进行语音合成,得到合成语音;对合成语音进行音色特征转换,得到目标语音,并对目标语音进行音频拆解,得到目标子语音;对目标子语音进行语言自然度评估,得到自然度得分;根据样本文本、自然度得分对目标子语音进行语义连贯度评估,得到语义连贯度得分;根据语义连贯度得分对初始语音合成模型进行筛选,得到目标语音合成模型;获取问题文本,通过目标语音合成模型对问题文本进行语音答复。本申请实施例能够提升人机语音交互的质量。
技术关键词
文本
语音答复方法
样本
词语
音色特征
人机语音交互
语义注意力
电子设备
标识
可读存储介质
人工智能技术
模块
音频
语句
处理器
跨模态
存储器
计算机
系统为您推荐了相关专利信息
多模态深度学习
智能辅助方法
医学影像数据
分词
文本数据提取
故障诊断方法
逻辑回归模型
故障诊断模型
水电工业
贝叶斯分类器