摘要
本说明书一个或多个实施例提供一种图像生成方法、设备、存储介质及程序产品。图像生成方法包括:在显示界面显示用户输入的文本内容,以及,在显示界面显示与用户上传的至少一个非文本媒体对应的可视化标识;若监听到针对文本内容的至少部分和任一可视化标识的混排事件,将文本内容的至少部分和混排事件指示的目标可视化标识进行混合排列,形成多媒体输入内容,并生成与目标可视化标识绑定的元数据,元数据至少用于记录目标可视化标识在多媒体输入内容中的目标位置、目标可视化标识指示的非文本媒体的存储路径和类型;若接收到图像生成指令,利用多媒体输入内容以及与目标可视化标识绑定的元数据,控制已训练完成的图像生成模型生成图像。
技术关键词
图像生成模型
多模态
多媒体
预训练语言模型
文本
图像生成方法
标识
生成指令
图像处理模型
语音识别模型
数据
处理器
音频
计算机程序产品
意图识别
参数
自然语言
系统为您推荐了相关专利信息
多维度分析方法
构建知识图谱
节点
动态更新
策略
标签数据库
文本分类方法
大语言模型
自然语言
计算机程序指令