一种视频理解的细粒度基准数据集构建方法和系统

正文

推荐专利

申请号：CN202510291006

申请日期：2025-03-12

公开号：CN120147782A

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开了一种视频理解的细粒度基准数据集构建方法和系统，涉及数据集构建技术领域，包括：对原始视频数据预处理生成多个人物视频片段，并确定各人物视频片段的人物标注信息；根据明确型任务从各人物视频片段选取明确型问题视频片段，采用关联的人物标注信息构建为明确型选择题；根据描述型任务从各人物视频片段选取描述型问题视频片段，结合多个多模态大语言模型生成描述型选择题；若各人工验证答案与对应的明确型答案项或描述型答案项匹配，则采用各明确型选择题和各描述型选择题构建人类行为视频基准数据集。通过半自动化技术生成细粒度的关于人类行为的视频理解基准数据集，有助于提升基准数据集可靠性。

技术关键词

数据集构建方法视频答案基准人物特征数据集构建系统音频半自动化技术大语言模型人脸多模态语音识别模型处理器人类序列人体计算机程序产品指令

系统为您推荐了相关专利信息

一种基于内网计算机的视频监控管理方法

视频监控管理方法视频监控管理系统视频分析地图可视化技术特征点集合

模型训练数据集生成方法、装置、计算机设备、可读存储介质和程序产品

大语言模型数据生成图表生成方法计算机设备

一种基于深度学习的人影作业实景智能监管系统

智能监管系统智能分析模块人影作业视频监控模块视频交换机

融合容量增量分析与时序特征的锂电池SOH动态修正方法

动态修正方法电池健康状态时序特征节点锂电池

基于智能数据采标的模型训练和内容审核管理系统

审核管理系统深度学习分类关键帧多模态隐马尔可夫模型

一种视频理解的细粒度基准数据集构建方法和系统

站点导航

APP 下载