摘要
本申请公开了一种图像处理方法、图像生成方法、电子设备及存储介质,涉及大模型技术中的图像处理领域。其中,该方法包括:获取待渲染文本的图像;利用多模态模型基于待渲染文本的图像进行文本生成,得到多个关键点和多个关键点对应的生成文本;利用多模态模型对多个关键点和多个关键点对应的生成文本进行处理,得到目标文本区域和目标文本区域对应的目标生成文本;基于目标文本区域将目标生成文本与待渲染文本的图像进行融合,得到目标图像。本申请解决了相关技术中由于生成文字后的生成图像与原始图像的差异较大,导致基于生成图像对原始图像进行后续处理的处理效果变差的技术问题。
技术关键词
关键点
多模态
图像处理方法
图像生成方法
场景文本图像
格式
可读存储介质
电子设备
生成文字
计算机程序产品
客户端
接口
参数
控制点
处理器
系统为您推荐了相关专利信息
动力电池测试方法
数学模型
新能源汽车
单体电池内阻
动力电池测试系统
无线采集系统
多模态生理
特征值
曲线
信号调制模块
仓库系统
多模态数据库
交叉注意力机制
模态特征
编码器
纤维素醚
多模态
羟乙基甲基纤维素
塑化剂
羟乙基纤维素