摘要
本发明涉及声纹识别技术领域,具体提供了一种声纹识别与语音合成结合的智能对话方法,包括步骤:实时获取用户语音输入信号;对语音输入信号进行声纹特征提取,获得包含用户身份特征和韵律特征的复合声纹向量;基于复合声纹向量进行用户身份匹配,并关联调用动态用户画像数据库;根据动态用户画像数据库中权重更新的动态参数生成个性化语义反馈内容;基于复合声纹向量中的音色表征向量,结合交互场景的时空特征参数,生成目标音色合成参数集;采用目标音色合成参数集对个性化语义反馈内容进行语音合成,并基于复合声纹向量中的实时韵律特征调整合成语音的韵律表达参数,最终输出个性化语音,实现“一人一音一策”的自然交互。
技术关键词
智能对话方法
画像数据库
韵律特征
参数
音色特征
场景
语义意图
动态
身份
智能对话装置
情感特征
交互特征
深度神经网络模型
声纹识别技术
个性化语音
数据更新
标签
可读存储介质