主体与行为偏离可控的监控视频语言数据集自动生成方法

AITNT
正文
推荐专利
主体与行为偏离可控的监控视频语言数据集自动生成方法
申请号:CN202510662239
申请日期:2025-05-22
公开号:CN120670746A
公开日期:2025-09-19
类型:发明专利
摘要
主体与行为偏离可控的监控视频语言数据集自动生成方法属于计算机视觉领域。本发明基于深度学习技术与数学中的交叉验证方法,研究了一种主体与行为偏离可控的监控视频语言数据集自动生成方法。首先使用目标追踪模块来构建增强的监控视频字幕模型,用于标注生成监控视频的描述文本,控制描述文本中的主体偏离程度。随后使用基于迭代偏离交叉验证的数据过滤模型对描述文本进行过滤,控制文本描述中的行为偏离程度,最终可获取主体与偏离可控的视频语言数据集。本发明所生产数据集具有已知的主体与行为偏离程度,因此可以为多模态监控视频语言理解模型等任务的训练提供有效帮助。
技术关键词
自动生成方法 文本 数据 特征协方差矩阵 视频编码策略 语言理解模型 样本 特征向量空间 预训练语言模型 注意力机制 协方差信息 筛选器 输出特征 度度量方法 交叉验证方法 视频分支 时序 字幕 深度学习技术
系统为您推荐了相关专利信息
1
融合遥感与AI分析的耕地流失动态监测方法及平台
耕地 动态监测方法 时序特征 数据采集频率 遥感技术
2
一种碳排放数据监测分析系统及方法
数据监测分析系统 排放量 发电量 周期 检测示踪气体
3
基于时间序列模型的电磁频谱态势预测方法及系统
时间序列模型 电磁频谱态势 数据 高性能频谱分析仪 监测站
4
一种柔性阵列式传感器信号传输系统
阵列式传感器 信号传输系统 噪声抑制模块 信号采集模块 柔性
5
一种基于配方的全线研发生产管理方法及系统
医学知识图谱 参数 管理方法 子系统 条件生成对抗
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号