摘要
本申请公开了一种基于模态融合的广告素材打标方法、系统、设备及介质,方法通过获取历史的广告素材标签数据集;将历史的广告素材标签数据集输入到预设的多模态打标模型中进行训练,获得训练之后的多模态打标模型;获取待打标的广告素材数据,并对待打标的广告素材数据进行预处理,获得预处理后的广告素材数据;将预处理后的广告素材数据输入到训练之后的多模态打标模型,获得所述广告素材数据对应的文字描述;根据文字描述信息,对所述广告素材数据进行打标。本申请通过构建跨模态特征融合模型,实现对文字、图像、视频等多源异构信息的联合语义理解,突破传统单模态处理的技术瓶颈,为多模态广告素材提供更精准、全面的标签体系。
技术关键词
打标方法
广告
视觉特征提取
计算机电子设备
特征提取模块
多模态特征融合
文本编码器
像素
可读存储介质
标签体系
数据处理模块
图像
多模块
处理器
视频
跨模态
系统为您推荐了相关专利信息
语音交互模块
声纹特征
语义特征
声纹模型
唤醒方法
生物传感器
健康监测方法
健康监测系统
模态特征
傅里叶变换方法
高速成像方法
双光子显微成像
深度学习网络
特征提取模块
网络模块
信息存储模块
人脸特征信息
人脸识别方法
特征提取模块
人脸识别装置