一种语义增强及多层次对齐的视频文本检索方法

正文

推荐专利

申请号：CN202510848794

申请日期：2025-06-24

公开号：CN120744178A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种语义增强及多层次对齐的视频文本检索方法、系统和设备，涉及数据检索领域。包括以下步骤:获取原始文本‑视频数据对数据集；使用外部知识检索模块检索与原始视频和文本相似的外部文本和视频；使用跨模态信息融合模块对互补信息进行特征融合，提取强化后的视频和文本的特征表示；利用模态间和模态内相似性约束，消除语义鸿沟实现精准检索；将查询文本按词性进行分解并编码，同时对视频帧进行编码并执行聚类操作，分别获取文本和视频的全局、动作和实体编码特征；利用多层次对齐实现视频和文本间相似性度量。本发明通过外部知识实现对视频文本的语义增强，同时使用多层次对齐策略实现文本细节和复杂视觉语义间信息交互，从而提升视频文本检索精度。

技术关键词

文本检索方法多层次语义文本编码器视频编码器跨模态编码特征视频帧特征实体聚类动作特征数据度量样本表达式索引

系统为您推荐了相关专利信息

计算数据的语义通信方法、装置及电子设备

图像编解码数据通信方法语义特征提取语义知识库

一种智能交互方法、装置、介质及电子设备

智能交互方法语句关键词语义交互内容

一种用于图像描述任务的视觉语言建模系统及方法

视觉特征提取建模系统高维向量空间文本编码器语言建模方法

多平台候选人信息智能同步搜索方法及系统

同步搜索方法特征数据库隐性特征多平台关键词

社交网络影响力预测方法及其系统

社交网络影响力社交媒体平台分子模型情感分析模型多层次指标体系

一种语义增强及多层次对齐的视频文本检索方法

站点导航

APP 下载