摘要
本发明公开了基于语音大模型的智能语音交互方法、装置、终端及介质,属于语音识别与交互技术领域,包括:当接收到唤醒指令,通过声纹识别模型识别发音人的声纹信息;当当前发音人身份是为已经通过声纹注册的所述指定用户,则获取当前发音人的提问信息,并从云端调取与当前发音人对应的指定用户的人物事迹文本的提示词,结合当前发音人提出的问题,生成与当前发音人对应的指定用户人物相关的事件文本信息;调用所述语音合成模型,将生成的事件文本信息、以发音人音色特征合成语音并输出播放。本发明支持用户自己上传人物事迹作为提示词,并将其与大模型结合,实现基于用户个性化信息的对话内容生成,为用户的使用提供了方便。
技术关键词
智能语音交互方法
发音
声纹识别模型
文本
音色特征
身份
智能语音交互装置
云端
音频
指令
交互技术
标识
电子设备
智能终端
输出模块
可读存储介质
程序
存储器