摘要
本发明公开了一种基于多模态融合的广告文案生成方法、装置、设备及介质,涉及广告营销技术领域。所述方法包括:获取目标视频的多模态数据,所述多模态数据包括视频的视觉数据、听觉数据及相关元数据,同时从本地知识库中提取关联数据;对所述多模态数据和本地知识库数据进行预处理,将其转化为可用于分析的特征形式。本发明通过借助本地知识库对多模态输入进行语义校准,确保生成内容严格遵循领域知识约束,解决了传统模型依赖隐式知识导致的偏差问题,消除了多模态信息歧义,实现文本、图像、结构化数据的协同语义生成,丰富内容维度,为智能生成技术在垂直领域的落地提供了高效解决方案。
技术关键词
广告文案生成方法
数据
视频
识别知识库
特征向量空间
多头注意力机制
融合特征
垂直度
强化学习算法
多模态特征
多平台
听觉
广告营销技术
姿态特征
视觉
表情特征提取
语义向量
系统为您推荐了相关专利信息
遥感识别方法
时空注意力机制
影像
长短期记忆神经网络模型
时序
可替换电池
巡检机器人充电
功率控制方法
巡检数据
巡检设备
机组运行数据
主汽温度
主汽压力
数据筛选方法
稳态