摘要
本发明涉及人工智能技术领域,公开了一种基于语音识别的交互方法、装置、设备及存储介质,其中方法包括:获取所采集的用户语音;采用识别模型将用户语音转换成语音文字,并识别得到说话人身份以及用户情绪;获取前述回话文本,采用语言模型将语音文字、说话人身份和用户情绪转换为提示词文本,根据前述回话文本和提示词文本生成目标回话文本;采用文本到语音模型,将目标回话文本转换为目标回话语音,控制扬声器播放目标回话语音。本发明可应用于金融科技、医疗等业务管理程序系统,解决了现有人机交互面临的智能化与情感交互双重局限问题,提升行业服务质量和用户粘性。
技术关键词
说话人身份
文本
语音特征
交互方法
历史交互信息
声纹识别模型
情绪识别模型
策略
数值
语音识别模型
分词
风格
生成提示词
扬声器
语音识别模块
程序系统
可读存储介质
人工智能技术