摘要
本发明涉及一种视频内容描述方法,所述方法包括:S1,获取视频流;S2,基于视频流相邻帧运动特征提取算法和聚类算法,从所述视频流中提取预设数目的关键帧;S3,采用区域特征提取的目标检测算法,从预设数目的关键帧中提取区域特征;S4,根据所述区域特征,基于自注意力机制算法,计算对应的区域注意力特征;S5,根据所述视频流,采用分类算法和视频流相邻帧运动特征提取算法,提取每一帧的视频帧特征;S6,根据所述区域注意力特征和视频帧特征,采用循环网络算法进行解码,得到视频内容的描述文本。
技术关键词
特征提取算法
视频流
视频帧特征
注意力机制算法
关键帧
区域特征提取
ResNet网络
位置编码信息
可读存储介质
解码
运动
电子设备
文本
计算机
聚类算法
存储器
系统为您推荐了相关专利信息
图像采集装置
远程会议设备
视频流
对象
视频会议方法
客服知识库
客服系统
分段
注意力机制算法
动态业务数据
自动化检测方法
位置偏差量
视频帧
序列
实时视频流
轨迹
层次聚类算法
卷积神经网络提取
匈牙利算法
神经网络架构