一种基于语音识别的交互方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510446634

申请日期：2025-04-10

公开号：CN120199252A

公开日期：2025-06-24

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了一种基于语音识别的交互方法、装置、设备及存储介质，其中方法包括：获取所采集的用户语音；采用识别模型将用户语音转换成语音文字，并识别得到说话人身份以及用户情绪；获取前述回话文本，采用语言模型将语音文字、说话人身份和用户情绪转换为提示词文本，根据前述回话文本和提示词文本生成目标回话文本；采用文本到语音模型，将目标回话文本转换为目标回话语音，控制扬声器播放目标回话语音。本发明可应用于金融科技、医疗等业务管理程序系统，解决了现有人机交互面临的智能化与情感交互双重局限问题，提升行业服务质量和用户粘性。

技术关键词

说话人身份文本语音特征交互方法历史交互信息声纹识别模型情绪识别模型策略数值语音识别模型分词风格生成提示词扬声器语音识别模块程序系统可读存储介质人工智能技术

一种基于语音识别的交互方法、装置、设备及存储介质

站点导航

APP 下载