以球员为中心的身份感知篮球视频字幕生成方法

AITNT
正文
推荐专利
以球员为中心的身份感知篮球视频字幕生成方法
申请号:CN202510051388
申请日期:2025-01-13
公开号:CN119990312A
公开日期:2025-05-13
类型:发明专利
摘要
以球员为中心的身份感知篮球视频字幕生成方法属于视频分析与理解领域。传统方法难以生成包含球员身份和细粒度动作的字幕。本发明首先收集篮球比赛数据,包括事件文字描述和视频,并为每个视频片段标注关键球员的坐标框。基于坐标框裁剪球员序列,组织成以球员为中心的序列片段集合,并训练球员身份识别网络提取球员视觉特征和身份信息。利用交叉注意力机制实现视频与球员特征的双向增强,并通过可学习查询向量自适应学习视频视觉上下文信息。最终,将上下文信息与多模态特征拼接作为大语言模型的输入,引导生成包含球员身份的文本描述。本发明构建了球员身份感知的篮球视频字幕数据集NBA‑Identity。
技术关键词
球员 交叉注意力机制 视频字幕生成方法 视觉特征 矩阵 多层感知器 大语言模型 身份 序列 文本 篮球 参数 前馈神经网络 语义 视频分析 线性
系统为您推荐了相关专利信息
1
基于时变可靠度的高超声速飞行器振动优化控制方法
振动控制系统 可靠度分析方法 高超声速飞行器 矩阵 优化控制方法
2
一种基于敲击声音仿真和深度学习的物体材质识别方法
物体材质识别方法 深度学习模型训练 特征提取器 加速度 网格
3
基于机器学习的流依赖背景场误差协方差动态调整方法
协方差矩阵 机器学习模型 四维变分同化系统 动态 扰动方法
4
基于检索增强的术后风险预测方法、系统及介质
特征提取器 表格 矩阵 风险预测方法 解码组件
5
一种生物类器官打印装置及打印方法
打印装置 打印模块 矩阵 气液两用泵 打印方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号