一种基于全局感知特征融合与样本关系学习的视频描述方法

正文

推荐专利

申请号：CN202410780281

申请日期：2024-06-17

公开号：CN118629026A

公开日期：2024-09-10

类型：发明专利

摘要

本发明提供一种基于全局感知特征融合与样本关系学习的视频描述方法，属于视频描述领域。所述视频描述方法包括利用Inception‑ResNet‑V2模型提取视频静态特征；利用C3D模型提取视频动态特征；利用Faster‑RCNN模型提取视频对象特征；利用SBERT模型提取中视频对应字幕的语义标签；使用提出的样本关系学习模块学习样本之间的关系特征，利用全局感知特征融合模块控制特征融合权重，缓解累积的权重分配偏差问题，提高生成字幕的确性。

技术关键词

感知特征语义标签静态特征样本语义特征动作特征关系对象视频特征提取输入解码器生成字幕编码器动态实体视觉控制模块

系统为您推荐了相关专利信息

一种基于相似性代理辅助的演化神经架构搜索方法和系统

多层感知器节点特征神经架构搜索神经网络架构高性能架构

一种图片分类模型训练及图片分类方法

客户端图片分类模型图片分类方法标签数据

输电线路走廊中树木冠幅的确定方法和电子设备

输电线路走廊多光谱遥感影像点云特征多层次特征图像

面向非独立同分布数据的联邦学习控制方法、系统和介质

中心服务器学习控制方法神经网络模型客户端学习控制系统

基于自注意力机制的智慧型滚珠丝杠寿命预测方法

振动特征注意力机制智慧型样本数据

一种基于全局感知特征融合与样本关系学习的视频描述方法

站点导航

APP 下载