融合多模态文本特征的视频文本检索人物轨迹生成方法

正文

推荐专利

申请号：CN202511059680

申请日期：2025-07-30

公开号：CN120929640A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了融合多模态文本特征的视频文本检索人物轨迹生成方法，包括S1，视频输入与目标检测，得到图像中所有N个人物的目标框(x1,y1,x2,y2)坐标位置；S2，特征提取；S3，将人物坐标(x1,y1,x2,y2)、文本向量和图像特征向量送入DeepSort模型，然后进行特征匹配，并将匹配后的特征存储至MySQL数据库中；S4，轨迹分析与展示。本发明实现了对视频中的人物衣着、穿戴和骑行工具等方面的文本描述，通过对数据库匹配定位目标行动轨迹；另外在原本的目标跟踪中增加了多模态的文本描述特征，对文本描述通过Bert模型实现词向量化，并在目标跟踪中的匈牙利匹配环节增加文本描述向量损失，避免由于遮挡或者多目标人物重叠后的TrackID交换的问题。

技术关键词

人物轨迹生成方法图像特征向量文本多模态骑行工具可视化工具坐标矩阵 YOLO模型 BERT模型图像特征提取匈牙利算法视频流卡尔曼滤波衣着对象

系统为您推荐了相关专利信息

基于多模态传感器的智能照明控制系统及方法

智能照明控制系统多模态传感器多模态数据采集指数决策控制模块

基于数字孪生的工业机器人健康状态监测方法及监测系统

健康状态监测方法数字孪生体图像特征数据多头注意力机制图像特征提取

基于大模型驱动的多智能体协作与动态提示案例的知识抽取方法及系统

案例库知识抽取方法文本多智能体协作信息抽取方法

集控站监控系统二进制文件防篡改方法和系统

文件防篡改方法服务器节点文本加密文件防篡改系统

基于BERT模型的事件图谱智能构建与分析方法及装置

BERT模型图谱分析方法结点文本

融合多模态文本特征的视频文本检索人物轨迹生成方法

站点导航

APP 下载