摘要
本公开提供了一种背景音频的确定方法、装置、电子设备及存储介质,属于多媒体技术领域。方法包括:调用大语言模型对视频进行多模态处理,得到视频的搜索词,搜索词包括多种视频信息,多种视频信息包括视频的视频内容信息、视频情感信息以及视频场景信息;基于多种视频信息中的视频内容信息、视频情感信息以及视频场景信息,确定查询顺序;按照查询顺序,基于搜索词和音频库中各个音频的标签,对音频库中的音频进行筛选,得到至少一个背景音频,音频库中每个音频的标签包括音频的音频内容信息、音频情感信息以及音频场景信息。该方法保障了背景音频与视频在内容、情感以及场景等多个维度上匹配,匹配程度更高,更加准确且符合用户需求。
技术关键词
视频情感信息
音频
情感关键词
搜索词
大语言模型
多模态
场景词库
情感词库
电子设备
标签
实体
图像
可执行程序代码
处理器
可读存储介质
风格
计算机程序产品
系统为您推荐了相关专利信息
信息智能识别方法
敏感信息识别
语义结构
初始聚类中心
实体
神经网络模型
语音特征
特征提取方式
融合特征
背景噪声
文本生成模型
字段
文本生成方法
样本
生成文本内容
视频
视觉
生成方法
TextRank算法
标签文本