多模态广告库存智能匹配系统的视频内容理解方法

正文

推荐专利

申请号：CN202510880057

申请日期：2025-06-27

公开号：CN120388324B

公开日期：2025-09-02

类型：发明专利

摘要

本申请涉及视频内容理解技术领域，具体涉及多模态广告库存智能匹配系统的视频内容理解方法，该方法包括：以原始广告视频的视频帧为基准，在每个视频帧的时间戳所在镜头中，分析相邻视频帧的相似度以及语音段对应特征矩阵元素的离散程度，确定第一搜索窗口；同时，分析文本片段在单位时间内的出现频率和持续时长，确认第二搜索窗口；基于搜索窗口，分析语音段和文本片段在对应窗口内与视频帧的特征相似程度，获取最优对齐路径；将语音段、文本片段的时间戳与视频帧时间戳对齐，通过多模态融合技术、深度学习模型实现多层级语义解析。本申请旨在同步音频、文本与视频帧之间的时序关系，提示视频内容理解的准确性。

技术关键词

视频内容理解方法智能匹配系统视频帧文本广告语音多模态融合技术视频内容理解技术序列镜头音频特征视觉特征深度学习模型因子 Sigmoid函数矩阵基准语义向量

多模态广告库存智能匹配系统的视频内容理解方法

站点导航

APP 下载