一种基于深度学习跨模态技术的无人机视频检索方法

AITNT
正文
推荐专利
一种基于深度学习跨模态技术的无人机视频检索方法
申请号:CN202510774162
申请日期:2025-06-11
公开号:CN120316305B
公开日期:2025-08-15
类型:发明专利
摘要
本发明公开了一种基于深度学习跨模态技术的无人机视频检索方法,包括:根据用户输入的文本,进行初步分类,获取待检测的时间、地点、对象和目的;从时间、地点、对象三个维度对原始视频进行预筛选,得到可能的关键帧和包含检测对象的目标框;根据改进后的VIT模型对文本和预筛选的关键帧进行精准匹配,得到准确图片帧;搭建基于GRU‑CRF的神经网络,根据待检测的目的调整GRU网络的步长,对准确图片帧进行处理,将属于同一个视频片段的图片帧归类,得到符合用户要求的视频片段。本发明从四个维度的信息抽取关键帧和对图片帧进行分类,极大地缩短了视频检索时长,提高了视频检索效率和准确性。
技术关键词
视频检索方法 图片 跨模态 文本 事件特征 关键帧 对象 无人机飞行高度 地点 卷积神经网络提取 多尺度特征提取 标签 CRF模型 注意力 分辨率 像素
系统为您推荐了相关专利信息
1
一种以症状清晰化为目的的智能问诊对话方法和系统
大语言模型 医疗知识图谱 计算机可读取存储介质 对话方法 策略
2
基于视频姿态捕捉的英语发音评测方法及系统
发音 动作特征 音频特征 序列 视频帧
3
一种基于数字文化领域大数据模型的部署方法和应用终端
注意力机制算法 数据 语音识别分析 查询方法 特征提取方法
4
一种用于烟草行业项目管理的电子档案管理方法、系统及电子设备
档案管理方法 主题 标签 书架 局部特征信息
5
图像分割方法、装置、电子设备及可读存储介质
文本 注意力 编码特征 解码模块 编码模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号