基于多模态大模型的传统媒体广告分离识别方法

正文

推荐专利

申请号：CN202510483820

申请日期：2025-04-16

公开号：CN120340545A

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的传统媒体广告分离识别方法，包括S1：提取电视、广播中的广告音视频信号，并对其进行预处理；S2：从预处理后的音视频信号提取电视、广播的音频特征，通过特征提取及特征检索的方式从连续视频中找出最长相同片段的子集，并记录该时间点头尾；S3：利用过往人工经验数据搭建传统媒体广告知识库，运用大语言模型及增强检索的方式，判断片段是否为广告，并提取出广告的文本边界；S4：利用VAD静音检测及说话人同步的方式，修订广告开头结尾边界。本方法在电视、广播特征提取过程中，运用神经网络和注意力机制，有效解决了传统媒体音频时间跨度长的问题，能够更好地提取音频的时序特征，提高广告匹配的准确性。

技术关键词

音频特征识别方法多模态 VAD算法文本大语言模型广告特征电视数据建立索引时序特征短时傅里叶变换前馈神经网络信号对音视频端点

系统为您推荐了相关专利信息

跨模态分块药盒文本预训练语言模型

内容生成方法文本视觉语义内容生成装置

大语言模型老师交互方法拾音装置指令

物流设备动态关联模型动态数据集排放量深度学习模型

基于呼吸生理特征的抗感染药物精准雾化给药系统

雾化给药系统抗感染药物 PID控制器患者参数

基于多模态大模型的传统媒体广告分离识别方法

站点导航

APP 下载