摘要
本申请公开了一种语音交互方法、装置、智能终端及可读存储介质,所述语音交互方法包括:响应用户的语音触发操作,采集所述用户的多模态信息;获取所述多模态信息中语音数据对应的语音特征和所述多模态信息中人脸数据对应的人脸特征;基于所述语音特征的语音情感以及人脸特征对应的人脸表情,识别所述用户对应的情感状态;基于所述情感状态对应的协议解析消息,生成数字人对应的互动信息,并根据所述互动信息控制所述数字人与所述用户进行动态交互。本申请提供的语音交互方案可以解决数字人在复杂的情感变化下的动作触发不够灵活的问题,从而提高交互能力。
技术关键词
语音交互方法
人脸特征
生成数字人
人脸表情
多模态信息
语音特征
智能终端
文本
语音交互装置
协议
动态
数据
可读存储介质
样本
检测人脸
消息
处理器
识别模块
系统为您推荐了相关专利信息
信息处理模型
音频单元
多模态信息
样本
语音输入信息
火灾报警信号
电气火灾预警
电气设备
指标
多模态信息融合
动态追踪方法
云台电机
骨架模型
云台控制器
PID控制器
融合特征
空间特征提取
图像特征提取
影像
计算机程序指令