摘要
本申请涉及数字人驱动交互技术领域,其具体地公开了一种虚拟数字人的实时驱动交互方法及系统,其采用基于深度学习的人工智能技术对数字人的对话输入文本进行语义解析,充分理解所述对话输入文本中各个动词之间的上下文语义关联,将各个动词的上下文语义特征与目标对象的人脸特征进行特征交互筛选,以将动作语义信息融入人脸特征中,进而基于融合动作语义信息的人脸特征,采用图像生成模型将其转化为连贯的数字人动作图像,以实现虚拟数字人的实时驱动与交互,可以有效提升虚拟数字人的动作表现能力,从而提高了交互的自然性和流畅性。
技术关键词
语义
编码向量
对象
交互方法
序列
模式
驱动交互系统
双曲正切函数
人脸特征提取
转换器结构
文本
卷积神经网络模型
图像生成模型
矩阵
特征值
幅值
系统为您推荐了相关专利信息
在线教育产品
个性化策略
LSTM神经网络
学生
情感分析模型
速度编码器
匈牙利算法
位置编码器
LSTM模型
轨迹
机器学习方法
力矩
CatBoost算法
样本
核聚变
阻塞性睡眠呼吸暂停
多尺度卷积神经网络
注意力
卷积特征
分段
协作设备
数据处理方法
通信装置
设备状态信息
执行设备