视频标签识别模型训练方法、视频标签识别方法及装置

AITNT
正文
推荐专利
视频标签识别模型训练方法、视频标签识别方法及装置
申请号:CN202411558148
申请日期:2024-11-04
公开号:CN119181001B
公开日期:2025-02-25
类型:发明专利
摘要
提供一种视频标签识别模型训练方法、视频标签识别方法及装置,属于人工智能技术领域,包括:获取第一训练样本集,每个训练样本包括样本视频、样本视频在时刻t的标签和样本视频的文本描述信息,针对每一训练样本,确定训练样本的样本视频的视觉特征,样本视频的视觉特征根据样本视频从时刻t0至时刻t的视频的视觉特征对K个类中心特征进行聚类更新得到,K个类中心特征为对样本视频在时刻t0之前的视频的视觉特征进行聚类得到,根据样本视频的视觉特征、样本视频的文本描述信息、样本视频的第一预测标签以及第一预设范式指令,对视频标签识别模型进行训练,视频标签识别模型包括视觉特征编码器、存储队列、预先训练的对齐模块和识别模型。
技术关键词
视觉特征 对齐模块 识别模型训练方法 标签识别方法 图像块特征 编码器 训练样本集 文本 队列 视频帧 指令 参数 聚类算法 标签识别装置
系统为您推荐了相关专利信息
1
一种自动驾驶视觉推理认知方法及相关装置
外侧膝状体 视觉推理 图像 生成场景 人脑
2
图像处理方法、装置、设备、介质及程序产品
视觉特征 斑点 透明度 融合特征 图像生成模型
3
一种接线盒故障检测系统、方法和电子设备
故障特征 故障检测系统 接线盒 多模态 时域特征
4
基于跨模态知识融合的小样本目标检测方法及系统
语义特征提取 跨模态 样本 门控神经网络 遥感图像数据
5
一种农业灾害预警决策方法及系统
预警决策方法 多光谱传感器 隐马尔可夫模型 动态时间规整算法 阶段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号