基于语音大模型的智能语音交互方法、装置、终端及介质

正文

推荐专利

申请号：CN202510844278

申请日期：2025-06-23

公开号：CN120472909A

公开日期：2025-08-12

类型：发明专利

摘要

本发明公开了基于语音大模型的智能语音交互方法、装置、终端及介质，属于语音识别与交互技术领域，包括：当接收到唤醒指令，通过声纹识别模型识别发音人的声纹信息；当当前发音人身份是为已经通过声纹注册的所述指定用户，则获取当前发音人的提问信息，并从云端调取与当前发音人对应的指定用户的人物事迹文本的提示词，结合当前发音人提出的问题，生成与当前发音人对应的指定用户人物相关的事件文本信息；调用所述语音合成模型，将生成的事件文本信息、以发音人音色特征合成语音并输出播放。本发明支持用户自己上传人物事迹作为提示词，并将其与大模型结合，实现基于用户个性化信息的对话内容生成，为用户的使用提供了方便。

技术关键词

智能语音交互方法发音声纹识别模型文本音色特征身份智能语音交互装置云端音频指令交互技术标识电子设备智能终端输出模块可读存储介质程序存储器

基于语音大模型的智能语音交互方法、装置、终端及介质

站点导航

APP 下载