摘要
本申请提供一种显示设备及观影交互方法,所述方法通过响应于用户基于目标媒资数据输入的第一交互指令,根据播放进度获取已播放片段数据,并提取视频特征、音频特征和文本特征,通过多模态融合技术特征融合视频特征、音频特征和文本特征得到多模态融合特征。在基于视频特征、音频特征和文本特征生成的角色网络图提取角色关系特征,从而生成交互反馈结果。本申请通过多模态融合技术通过多种特征融合的方式智能、准确地对目标媒资数据执行内容理解,从而向用户提供与目标媒资数据内容相符的交互反馈结果,提高内容理解准确性。
技术关键词
音频特征
融合特征
显示设备
关系
多模态融合技术
文本
交互方法
控制器
阶段
表情特征
样本
指令
显示器
存储器
标签
数据更新
视频帧
系统为您推荐了相关专利信息
深度特征融合网络
带钢热连轧
融合特征
层流冷却
长短期记忆神经网络
智能驾驶功能
车辆
提示方法
频率
驾驶员身份识别
位置特征信息
动态位置编码
图像位置特征
图像特征信息
图像块特征
性能指标数据
传输路径
节点
TOPSIS算法
策略
频繁模式挖掘方法
孪生神经网络
卷积神经网络模块
评价预测模型
多层感知机