摘要
本申请涉及虚拟人驱动领域,其具体公开了一种基于多元感知的虚拟人驱动方法及装置、设备、存储介质,其使用基于深度学习领域的人工智能技术来对用户的语音和人脸图像进行特征提取与编码,得到虚拟人渲染后的RGB图像。这样,通过利用用户的多元信息,提高了虚拟人的感知和理解用户行为、情感和环境方面的能力。
技术关键词
面部
驱动方法
度量
双向注意力机制
词嵌入向量
矩阵
计算机可执行指令
人脸
图像
卷积神经网络模型
基板管理控制器
转换器
编码器
存储计算机程序
分词
文本
特征提取模块
人工智能技术
语音编码
系统为您推荐了相关专利信息
智能检测系统
注意力神经网络
多模态
老年人
心率测量仪
动态优化方法
面部关键点检测
多模态
面部表情识别
光照
形态分析方法
原始图像数据
相似性度量方法
深度学习方法
引入注意力机制
风电机组叶片
指标
CANopen主站
故障诊断算法
在线监测系统
视频内容特征
拟人化交互方法
多模态情感识别
个性化头像
面部