摘要
一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质,方法包括:对场景文本图像训练集进行预处理,得到预处理后的场景文本布局生成训练集、场景文本图像生成训练集和场景文本图像生成测试集;构建背景图像生成模块、层次化布局生成模块和场景文本图像生成模块;构建完整的任意形状场景文本图像生成模型;分别对层次化布局生成模块和场景文本图像生成模块进行训练,得到训练后的层次化布局生成模块和场景文本图像生成模块的权重文件;模型推理,得到最终的场景文本图像;系统、设备及介质用于实现该方法;本发明能够不依赖用户输入布局,自动化的生成任意形状场景文本图像。
技术关键词
场景文本图像
布局驱动
字符
训练集
场景文本检测
生成方法
语句
模块
网络
图像特征提取
图像编码器
文本编码器
噪声
控制点
解码器
匈牙利算法
系统为您推荐了相关专利信息
暂态稳定评估
电力系统数据库
焦点损失函数
有功功率
暂态仿真
故障特征
生成服务器
语音录入设备
场景
分析系统
煤矿顶板
实体属性抽取模型
指数
分析方法
属性匹配