基于文生图的多轮图像修改处理方法、装置及终端

正文

推荐专利

申请号：CN202510666312

申请日期：2025-05-22

公开号：CN120655750A

公开日期：2025-09-16

类型：发明专利

摘要

本发明公开了基于文生图的多轮图像修改处理方法、装置及终端，属于人工智能图像生成技术领域。该方法包括：接收用户输入的原始自然语言需求并通过自然语言理解模块提取初步关键词构建初步指令向量；基于本地词表及语义扩展策略对初步关键词进行自动补全与丰富化处理，得到补全后的文生图描述；将补全后的文生图描述输入文生图模型生成初始图像；当接收到修改请求时，调用指令编辑模型在初始图像基础上进行局部或全局编辑，进行一次或多次自适应重绘生成重绘图像。本发明还提供了相应的处理装置、智能终端及存储介质。该方法通过多轮交互式修改，实现了图像生成过程的精确控制，提高了文生图系统的可用性和用户体验。

技术关键词

自然语言理解关键词编辑指令语义人工智能图像智能终端基础策略模块生成技术电子设备管理器可读存储介质程序形态存储器处理器

系统为您推荐了相关专利信息

GPU服务器资源动态分配管理方法、装置、设备及介质

管理方法任务调度资源指令管理装置

新媒体AI营销内容创作方法、装置、设备及介质

创作意图自然语言解析关键词平台模板

牙模型的磨耗程度编辑方法、装置、设备及存储介质

牙模型磨耗特征值拉普拉斯顶点

冶炼金属加入配比计算方法、装置、设备、存储介质及产品

线性规划算法计算方法计算机程序指令有害元素含量计算机程序产品

异常订单检测方法和系统

人工智能模型异常订单物流服务端轨迹

基于文生图的多轮图像修改处理方法、装置及终端

站点导航

APP 下载