摘要
本申请公开了一种视频处理方法和装置、存储介质及电子设备。其中,该方法包括:在目标视频播放过程中,响应于对视频帧的触发操作,获取关键视频帧,其中,触发操作包括通过手势交互方式执行的触发操作和对视频帧中的视觉元素执行的标记处理;通过对关键视频帧进行多模态内容识别,得到多模态搜索信息;通过将多模态搜索信息和历史行为数据输入目标处理模型,得到与视频观看进度相匹配的一组关键搜索信息,其中,历史行为数据包括基于多模态搜索信息对视频帧执行过的操作数据;基于视频观看进度,在视频画面中动态显示与基于一组关键搜索信息相关联的注释内容。本申请解决了在显示视频内容的关联信息过程中出现的灵活性较差的技术问题。
技术关键词
视频帧
多模态
手势
画面
数据
电子设备
标记
处理单元
视觉
元素
计算机
终端设备
存储器
轨迹
处理器
周期
程序
系统为您推荐了相关专利信息
大豆
影像数据获取方法
指数
图像分割
卫星多光谱
指纹特征
精准定位方法
精准定位系统
融合滤波
特征值
轨道车辆
定位传感器
实时位置
生成方法
组合导航设备
日用电量
太阳能光热发电
发电量
匹配模块
电网用电量预测
烹饪设备控制方法
气体传感器阵列
剩余烹饪时间
算法模型
控制策略