摘要
本申请涉及一种显示设备,包括:显示器,被配置为显示来自广播系统或网络和/或用户接口的内容;以及至少一个处理器,其与所述显示器连接,并且被配置为执行指令以使所述显示设备:响应于语音查询指令,获取对应的回复文本,基于所述回复文本,生成音频数据、文本数据以及动作控制数据;通过动作驱动模型对所述音频数据、所述文本数据以及所述动作控制数据进行处理,得到动作驱动数据;播放所述音频数据和目标视频,并控制所述显示器显示所述回复文本,所述目标视频为基于所述动作驱动数据对虚拟对象进行控制生成的视频。肢体动作更加灵动。
技术关键词
对齐模块
编码器
样本
解码器
文本
显示设备
语音特征提取
生成音频数据
融合特征
语义向量
虚拟对象
显示器
广播系统
标识
处理器
系统为您推荐了相关专利信息
拼接模块
语义
道路病害检测方法
上采样
多层感知机
动作识别模型
样本
视觉特征提取
文本
特征提取网络
生成代码
工作流
计算机程序指令
自然语言文本
表达式
人眼视线估计方法
细粒度特征
特征提取网络
池化特征
文本编码器