摘要
本发明公开了一种用于事件流的多模态大模型解译方法,解决了多模态大模型对事件流感知解译难的问题,属于计算机视觉领域;包括:将极性事件流数据重构为灰度图像序列;通过Lucas‑Kanade光流算法判断是否需要运动放大,是则进行傅里叶变换、复数可操控金字塔和S变换,并通过带通滤波器去噪,使用双向差分方法结合放大参数进行增强;将增强相位分量特征子带与幅值分量特征子带融合,恢复空间分辨率得到重构频域信号;通过逆傅里叶变换得到运动放大的灰度图像序列,计算归一化互相关参数动态调整放大参数;将运动放大的灰度图像序列输入多模态大模型中输出解译事件描述;本发明实现了多模态大模型对事件流的有效感知和精准解译。
技术关键词
分量特征
带通滤波器
复信号
图像
序列
高低通滤波器
解译方法
事件流数据
运动
金字塔
计算方法
参数
多模态
重构
矩阵
光流场
速度
分辨率
事件相机
像素
系统为您推荐了相关专利信息
保护组件
碎屑
实时状态信息
清洁方法
工作路径信息
数据审核方法
政务
数据储存单元
图像解析单元
图像识别技术
电磁层析成像
深度残差网络模型
系统仿真模型
有限元仿真方法
训练样本集