摘要
本公开涉及计算机技术领域,公开了一种多模态内容生成方法、装置、可读介质及电子设备。该方法可以根据用户侧对应的主题标签从多数据源采集初始物料,以及基于用户侧对应的内容风格,在初始物料的基础上生成该内容风格对应的多模态内容;其中,多模态内容可以包括摘要文本、描述图像、描述音频、描述视频中的至少两种。该方案在多模态内容生成中,基于一致的初始物料生成不同模态的内容,从而降低了多模态之间的语义一致性风险,且便于统一协调生成流程,可以根据业务需求自动化地同时或先后生成不同模态的内容,成本低,生产效率高,无需人工过多干预,生成内容质量稳定。
技术关键词
多模态
文本生成模型
内容生成方法
风格
视频生成模型
图像生成模型
音频
摘要
基础
内容生成装置
主题
标签
电子设备
数据采集模块
处理器
介质
指令
系统为您推荐了相关专利信息
自主移动设备
风格
驾驶环境信息
计算机执行指令
控制自主移动
图像特征向量
多模态特征
文本编码器
文本特征向量
地铁场景
游戏场景
形态
信息处理方法
计算机可执行指令
图形用户界面
组织工程软骨体外构建
高分辨率共聚焦显微镜
荧光显微镜
支架
乳酸杆菌益生菌