一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质

AITNT
正文
推荐专利
一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质
申请号:CN202510126918
申请日期:2025-01-27
公开号:CN120070666B
公开日期:2025-11-21
类型:发明专利
摘要
一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质,方法包括:对场景文本图像训练集进行预处理,得到预处理后的场景文本布局生成训练集、场景文本图像生成训练集和场景文本图像生成测试集;构建背景图像生成模块、层次化布局生成模块和场景文本图像生成模块;构建完整的任意形状场景文本图像生成模型;分别对层次化布局生成模块和场景文本图像生成模块进行训练,得到训练后的层次化布局生成模块和场景文本图像生成模块的权重文件;模型推理,得到最终的场景文本图像;系统、设备及介质用于实现该方法;本发明能够不依赖用户输入布局,自动化的生成任意形状场景文本图像。
技术关键词
场景文本图像 布局驱动 字符 训练集 场景文本检测 生成方法 语句 模块 网络 图像特征提取 图像编码器 文本编码器 噪声 控制点 解码器 匈牙利算法
系统为您推荐了相关专利信息
1
一种基于具身智能的快速路面缺陷巡检方法
路面缺陷 路面特征 模块 网络结构 图像
2
基于自适应早退的暂态稳定评估的方法及系统
暂态稳定评估 电力系统数据库 焦点损失函数 有功功率 暂态仿真
3
基于大数据的服务器运行故障解决方案分析系统及方法
故障特征 生成服务器 语音录入设备 场景 分析系统
4
一种基于知识图谱的煤矿事故致因分析方法
煤矿顶板 实体属性抽取模型 指数 分析方法 属性匹配
5
管道环扫声呐图像缺陷目标检测方法、系统、介质及设备
声呐 图像 管道 注意力机制 训练集
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号