摘要
本公开提供了一种多模态内容生成方法和装置,涉及人工智能技术领域,具体涉及人工智能内容生成技术领域。具体实现方案为:向用户显示至少一个素材,所述素材包括至少一种模态;获取所述用户对所述素材的用户指令;基于所述素材以及所述用户指令生成多模态内容,所述多媒体内容包括至少一种模态。本公开增强了用户对生成内容的细节控制粒度,提高了内容生成的灵活性,提高了多模态内容个性化生成的用户体验。
技术关键词
多模态
内容生成方法
多媒体
人工智能内容
内容生成装置
自定义指令
人工智能技术
生成技术
计算机程序产品
处理器通信
多模型
可读存储介质
存储器
电子设备
离线
文本
音频