一种视频理解的细粒度基准数据集构建方法和系统

AITNT
正文
推荐专利
一种视频理解的细粒度基准数据集构建方法和系统
申请号:CN202510291006
申请日期:2025-03-12
公开号:CN120147782A
公开日期:2025-06-13
类型:发明专利
摘要
本发明公开了一种视频理解的细粒度基准数据集构建方法和系统,涉及数据集构建技术领域,包括:对原始视频数据预处理生成多个人物视频片段,并确定各人物视频片段的人物标注信息;根据明确型任务从各人物视频片段选取明确型问题视频片段,采用关联的人物标注信息构建为明确型选择题;根据描述型任务从各人物视频片段选取描述型问题视频片段,结合多个多模态大语言模型生成描述型选择题;若各人工验证答案与对应的明确型答案项或描述型答案项匹配,则采用各明确型选择题和各描述型选择题构建人类行为视频基准数据集。通过半自动化技术生成细粒度的关于人类行为的视频理解基准数据集,有助于提升基准数据集可靠性。
技术关键词
数据集构建方法 视频 答案 基准 人物特征 数据集构建系统 音频 半自动化技术 大语言模型 人脸 多模态 语音识别模型 处理器 人类 序列 人体 计算机程序产品 指令
系统为您推荐了相关专利信息
1
一种基于内网计算机的视频监控管理方法
视频监控管理方法 视频监控管理系统 视频分析 地图可视化技术 特征点集合
2
模型训练数据集生成方法、装置、计算机设备、可读存储介质和程序产品
大语言模型 数据 生成图表 生成方法 计算机设备
3
一种基于深度学习的人影作业实景智能监管系统
智能监管系统 智能分析模块 人影作业 视频监控模块 视频交换机
4
融合容量增量分析与时序特征的锂电池SOH动态修正方法
动态修正方法 电池健康状态 时序特征 节点 锂电池
5
基于智能数据采标的模型训练和内容审核管理系统
审核管理系统 深度学习分类 关键帧 多模态 隐马尔可夫模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号