摘要
主体与行为偏离可控的监控视频语言数据集自动生成方法属于计算机视觉领域。本发明基于深度学习技术与数学中的交叉验证方法,研究了一种主体与行为偏离可控的监控视频语言数据集自动生成方法。首先使用目标追踪模块来构建增强的监控视频字幕模型,用于标注生成监控视频的描述文本,控制描述文本中的主体偏离程度。随后使用基于迭代偏离交叉验证的数据过滤模型对描述文本进行过滤,控制文本描述中的行为偏离程度,最终可获取主体与偏离可控的视频语言数据集。本发明所生产数据集具有已知的主体与行为偏离程度,因此可以为多模态监控视频语言理解模型等任务的训练提供有效帮助。
技术关键词
自动生成方法
文本
数据
特征协方差矩阵
视频编码策略
语言理解模型
样本
特征向量空间
预训练语言模型
注意力机制
协方差信息
筛选器
输出特征
度度量方法
交叉验证方法
视频分支
时序
字幕
深度学习技术
系统为您推荐了相关专利信息
耕地
动态监测方法
时序特征
数据采集频率
遥感技术
数据监测分析系统
排放量
发电量
周期
检测示踪气体
时间序列模型
电磁频谱态势
数据
高性能频谱分析仪
监测站
阵列式传感器
信号传输系统
噪声抑制模块
信号采集模块
柔性
医学知识图谱
参数
管理方法
子系统
条件生成对抗