摘要
本申请提供的融合歌声情绪的虚拟形象表情控制方法、装置及设备,涉及计算机技术领域。在本申请中,首先,获取目标演唱用户的用户脸部图像和演唱歌曲音频;其次,基于用户脸部图像确定目标虚拟形象的初始表情控制数据;然后,对演唱歌曲音频进行语义挖掘,形成歌曲音频语义向量;进一步,基于歌曲音频语义向量,对初始表情控制数据进行优化,形成目标表情控制数据;最后,基于目标表情控制数据,对目标虚拟形象的表情进行控制。基于上述内容,可以改善现有技术中存在的歌曲演唱应用场景中的虚拟形象表情控制的精度相对不高的问题。
技术关键词
表情控制方法
局部特征信息
语义向量
音频
时间域
脸部特征
注意力解码
频率
编码
图像
交叉点
存储计算机程序
数据获取模块
坐标
存储器
参数
控制模块
系统为您推荐了相关专利信息
实体
关系识别方法
多模态数据融合
音频编码器
识别模块
语音用户界面
多通道
协方差矩阵
语音活动检测
短时傅里叶变换
文本转换系统
语音特征提取
语音识别模型
音频采集模块
语音识别模块