摘要
本申请公开了一种广告识别方法、装置、计算设备、存储介质以及程序产品,所述方法包括:获取待识别视频,待识别视频包括至少一个场景片段,场景片段包括图像帧和音频数据;获取场景片段的图像帧包含的文字内容;获取场景片段的音频数据对应的音频文本信息;获取表征场景片段的画面内容的文本摘要;将经时间对齐后的文字内容、音频文本信息和文本摘要输入预设学习模型,确定场景片段中是否包括广告信息。本申请可提高广告识别的准确率和识别效率。
技术关键词
广告识别方法
音频
场景切换点
摘要
自动语音识别系统
视频
表征场景
图像编码器
数据
画面
存储计算机程序
大语言模型
计算机程序产品
文本识别
处理器
识别装置
系统为您推荐了相关专利信息
数据库索引系统
图片
语音识别技术
关键词
网页形式
输液控制器
控制芯片
检测板
通讯电路
触摸屏驱动电路
编码向量
语义
电源控制模块
逻辑判断单元
便携式设计