摘要
本发明公开了基于文生图的多轮图像修改处理方法、装置及终端,属于人工智能图像生成技术领域。该方法包括:接收用户输入的原始自然语言需求并通过自然语言理解模块提取初步关键词构建初步指令向量;基于本地词表及语义扩展策略对初步关键词进行自动补全与丰富化处理,得到补全后的文生图描述;将补全后的文生图描述输入文生图模型生成初始图像;当接收到修改请求时,调用指令编辑模型在初始图像基础上进行局部或全局编辑,进行一次或多次自适应重绘生成重绘图像。本发明还提供了相应的处理装置、智能终端及存储介质。该方法通过多轮交互式修改,实现了图像生成过程的精确控制,提高了文生图系统的可用性和用户体验。
技术关键词
自然语言理解
关键词
编辑
指令
语义
人工智能图像
智能终端
基础
策略
模块
生成技术
电子设备
管理器
可读存储介质
程序
形态
存储器
处理器
系统为您推荐了相关专利信息
线性规划算法
计算方法
计算机程序指令
有害元素含量
计算机程序产品