摘要
本发明公开了一种基于多模态大模型的传统媒体广告分离识别方法,包括S1:提取电视、广播中的广告音视频信号,并对其进行预处理;S2:从预处理后的音视频信号提取电视、广播的音频特征,通过特征提取及特征检索的方式从连续视频中找出最长相同片段的子集,并记录该时间点头尾;S3:利用过往人工经验数据搭建传统媒体广告知识库,运用大语言模型及增强检索的方式,判断片段是否为广告,并提取出广告的文本边界;S4:利用VAD静音检测及说话人同步的方式,修订广告开头结尾边界。本方法在电视、广播特征提取过程中,运用神经网络和注意力机制,有效解决了传统媒体音频时间跨度长的问题,能够更好地提取音频的时序特征,提高广告匹配的准确性。
技术关键词
音频特征
识别方法
多模态
VAD算法
文本
大语言模型
广告特征
电视
数据建立索引
时序特征
短时傅里叶变换
前馈神经网络
信号
对音视频
端点
系统为您推荐了相关专利信息
物流设备
动态关联模型
动态数据集
排放量
深度学习模型
雾化给药系统
抗感染药物
PID控制器
患者
参数