摘要
本公开关于一种多媒体资源生成方法、装置、电子设备及存储介质。该方法包括:获取用于多媒体资源生成的第一文本提示词以及参考多媒体资源;基于双编码器对参考多媒体资源进行语义提取和多媒体细节提取,得到第一多媒体语义特征和第一多媒体细节特征;将第一文本提示词对应的第一文本特征、第一多媒体语义特征和第一多媒体细节特征进行拼接,得到第一序列拼接特征;将第一序列拼接特征输入目标Transformer模型进行特征交互处理,得到第一目标交互特征;将预设噪声信息和第一目标交互特征,输入目标扩散模型进行多媒体资源生成处理,得到第一生成多媒体资源。根据本公开提供的技术方案,能够适配更加丰富多样的多媒体资源生成场景。
技术关键词
交互特征
生成多媒体
噪声信息
双编码器
资源
文本
生成方法
样本
序列
电子设备
拼接模块
编码模块
语义特征提取
多模态信息
计算机
处理器
可读存储介质
系统为您推荐了相关专利信息
情景模型
协同优化方法
邻域
模型库
协同优化系统
生成对抗神经网络
推荐方法
协同过滤推荐
特征提取能力
因子
仿真数据
加权融合算法
分析系统
可编程参数
仿真模型
计划
监控模块
特征匹配算法
数据存储结构
评估算法
学生信息管理
教学资源库
管理系统
回归分析预测模型
协同过滤算法