基于多模态语义重心评估的视频标签提取方法及系统

正文

推荐专利

申请号：CN202510684350

申请日期：2025-05-26

公开号：CN120544611A

公开日期：2025-08-26

类型：发明专利

摘要

本申请公开了基于多模态语义重心评估的视频标签提取方法及系统，涉及人工智能技术领域，方法包括：对视频彩铃进行场景分割，得到多个场景片段；对各个场景片段提取得到视觉特征和音频特征；根据语义重心评估得到视觉特征和音频特征的重要性权重；通过可配置的标签层级架构生成多粒度的候选标签，并根据重要性权重对各个候选标签分配标签权重；对分配标签权重后的各个候选标签进行后处理，进而输出结构化的标签列表。本申请通过生成准确、丰富、多层次的标签，并根据语义重心评估得到的重要性权重对各个候选标签分配标签权重，显著提升视频彩铃的标签语义理解程度，从而提高了彩铃内容的搜索匹配度和用户查找效率。

技术关键词

视频标签提取方法音频特征视觉特征多模态语义视频彩铃场景关键帧层级定义标签可读存储介质事件特征特征提取模块情感特征人工智能技术列表电子设备处理器

基于多模态语义重心评估的视频标签提取方法及系统

站点导航

APP 下载