一种视频标注生成方法、装置及相关设备

AITNT
正文
推荐专利
一种视频标注生成方法、装置及相关设备
申请号:CN202411910485
申请日期:2024-12-24
公开号:CN119729146A
公开日期:2025-03-28
类型:发明专利
摘要
本申请提供了一种视频标注生成方法、装置及相关设备,方法包括:将获取的多个原始视频输入训练好的视频标注生成模型中;针对每个原始视频获取其视觉特征;基于视觉特征,获取实体表征、谓语表征和句子表征;将获取的句子表征分为偶数视频帧句子表征和奇数视频帧句子表征,并根据偶数视频帧句子表征和奇数视频帧句子表征采用对比学习的方式进行相似度矩阵监督;对各个原始视频的输出特征进行整合并获取用于生成字幕的聚合特征。本申请设计了三种视频编码器对时序细节和空间信息进行建模,这有助于从不同角度和粒度捕捉视频帧的特征,增强帧间信息的提取,避免帧间信息内容提取不充分。
技术关键词
视频帧 视觉特征 运动特征 生成方法 上下文特征 实体 输出特征 生成字幕 BiLSTM模型 计算机程序产品 注意力机制 解码模块 采样模块 视频编码器 处理器 矩阵 物体 电子设备
系统为您推荐了相关专利信息
1
一种头像生成方法、系统、设备及计算机可读存储介质
面部图像特征 文本 头像生成方法 图像生成网络 随机噪声
2
一种融合朝向多样性指导的行人再识别数据生成方法
数据生成方法 身份 语义标签 样本 图像
3
航空发动机故障数据的生成方法、装置和计算机设备
数据生成模型 航空发动机故障 故障场景 多场景 数据分布
4
病历生成模型训练方法、病历生成方法及相关设备
病历 生成模型训练方法 样本 生成方法 标签
5
一种芯片缺陷样本生成方法及设备
缺陷尺寸 样本生成方法 芯片结构 参数 标识
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号