摘要
一种视频高光检测方法、装置、介质、设备及产品,视频高光检测方法包括:获取视频的多模态信息,所述多模态信息包括视频帧、音频信息和文本信息,所述文本信息包括文本内容和所述文本内容在所述视频中的时间信息;根据所述多模态信息,确定所述视频的视频特征和文本特征;根据所述时间信息,对所述视频特征和所述文本特征进行模态对齐,得到模态对齐后的目标视频特征;根据所述目标视频特征,确定所述视频的高光片段。通过上述技术方案,能够使得目标视频特征是根据视频特征和具有时间关联性的文本特征进行融合得到的,保证视频特征与文本特征进行融合的准确性,提高视频高光检测的准确性。
技术关键词
高光检测方法
多模态信息
文本
掩码矩阵
视频帧
元素
注意力
存储装置
对齐模块
计算机程序产品
音频特征
视觉特征
介质
电子设备
尺寸
系统为您推荐了相关专利信息
动态权重分配
预警方法
传感器特征
多模态数据采集
工地
连续型
混合交通流
深度强化学习模型
决策方法
策略
实时图像
图像识别模型
维保
存放平台
识别无人机
文本特征向量
系统故障预测
问答知识库
个性化知识图谱
模拟设备
神经网络模型
数据加载方法
编译方法
数据加载装置
计算机程序产品