基于帧间差分的交通视频问答方法

正文

推荐专利

基于帧间差分的交通视频问答方法

申请号：CN202510662725

申请日期：2025-05-22

公开号：CN120689821A

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了基于帧间差分的交通视频问答方法，基于交通视频的局部突变特性，创新性地在图像预训练模型基础上构建帧间差分提取模块：通过相邻帧的像素级差异计算，有效捕捉运动目标的突变特征。设计门控特征融合机制，在融合问题特征的基础上，动态对齐差分特征与视觉特征的空间分布，实现静态场景与动态变化的协同表征。为增强跨模态特征对齐，提出了层次对比学习策略：在底层实施差分‑视觉特征对比以强化局部动态感知，在高层进行文本‑视觉对比以建立全局语义关联。实验结果表明，本发明在SUTD‑TrafficQA基准数据集上提高了分类性能。

技术关键词

视觉特征视频问答方法答案文本分类准确率语义交通抑制背景噪声交叉注意力机制动态 BERT模型跨模态视频帧间多模态特征融合视觉预训练模型

系统为您推荐了相关专利信息

一种基于知识图谱推理的目标关键部位识别方法

关键部位识别方法知识图谱推理视觉特征融合特征构建知识图谱

基于动态时空超图与大语言模型的多模态交通流预测方法

交通流预测方法特征提取模块大语言模型交通流预测模型文本

一种大语言模型评估系统及方法

大语言模型评估系统鲁棒性生成优化建议报告

一种基于人工智能的情绪识别系统及方法

情绪识别系统多模态人工智能模型生成警报信号语音

一种基于音频增强的音视频语音识别方法及系统

语音识别方法音视频视觉特征提取音频特征提取机器可读程序

基于帧间差分的交通视频问答方法

站点导航

APP 下载