摘要
本发明实施例提供了一种图像生成方法、装置、电子设备及存储介质,涉及人工智能技术领域。方法包括:获取第一文本,第一文本中包含至少一个人物的待利用描述文本;提取第一文本中包含的每一人物的待利用描述文本;按照镜头对第一文本进行拆分处理,得到各镜头的镜头描述文本;一个镜头描述文本表示:该镜头描述文本表征的镜头中的人物,以及该镜头中的人物所处的状态;基于每一镜头描述文本,以及该镜头描述文本中的人物的待利用描述文本,得到该镜头描述文本对应的第一提示词;基于预先训练好的第一文生图模型,对该镜头描述文本对应的第一提示词进行处理,得到该镜头描述文本对应的图像。保证同一人物在生成的不同图像中的连续性和统一性。
技术关键词
文本
镜头
大语言模型
图像生成方法
参数
拆分规则
样本
图像生成装置
通信接口
电子设备
可读存储介质
人工智能技术
存储器
处理器
模块
计算机
标签
连续性
程序
系统为您推荐了相关专利信息
光学定位仪
发热元件
温控系统
温控电路
转换算法
语音交互方法
车辆状态信息
车载语音系统
大语言模型
多轮对话
上下文特征
频域特征
场景特征
语义分割模型
像素点