摘要
本申请公开了一种数字人驱动方法、装置、设备及存储介质,涉及人工智能技术领域,该方法包括:将待播报音频输入至预设数字人手部动作驱动模型;通过编码器对待播报音频进行编码,获得待播报音频对应的目标音频特征;通过解码器基于目标音频特征,以及待驱动数字人的历史手部动作关键点坐标确定目标手部动作关键点坐标;基于目标手部动作关键点坐标对待驱动数字人进行驱动。本发明基于待播报音频对应的目标音频特征以及历史手部动作关键点坐标确定目标手部动作关键点坐标,以基于目标手部动作关键点坐标驱动数字人,解决了现有技术中的数字人客服在与用户交流时由于缺少手部动作导致用户体验不佳的技术问题。
技术关键词
音频特征
手部关键点
坐标
解码器
编码器
驱动方法
解码模块
人体关键点检测模型
音视频
映射关系表
线性
注意力
矩阵
编码模块
人工智能技术
音频编码
驱动设备
系统为您推荐了相关专利信息
双目相机
接触式
频域特征
深度学习算法
Gabor滤波器
命名实体识别模型
智能分析方法
双向长短期记忆网络
文本
规范数据格式