基于条件扩散模型的可控东南亚文本图像生成方法及装置

AITNT
正文
推荐专利
基于条件扩散模型的可控东南亚文本图像生成方法及装置
申请号:CN202510841949
申请日期:2025-06-23
公开号:CN120894599A
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及基于条件扩散模型的可控东南亚文本图像生成方法及装置,属于自然语言处理技术领域。东南亚语言属于低资源语言,针对东南亚语言场景文本图像生成中合成数据质量较低、与真实场景差距较大,导致训练的场景文本识别模型在实际应用中性能下降的问题,本发明提出了一种基于条件扩散模型的可控东南亚文本图像生成方法,主要包括东南亚语言文本草图图像构建、融合场景风格信息的文本编码和基于注意力机制的文本图像控制生成三部分。根据这三个功能模块化研制基于条件扩散模型的可控东南亚文本图像生成装置,有效提升了生成的东南亚语言场景文本图像在视觉质量和结构一致性,有助于提升识别模型在真实场景中的识别性能。
技术关键词
图像生成方法 变分自动编码器 场景文本图像 Canny算子 字符 区域生长算法 噪声 融合场景 非暂态计算机可读存储介质 渲染技术 场景文本识别 情感分析系统 低资源语言 注意力机制 语义
系统为您推荐了相关专利信息
1
一种车辆信息的安全加密方法、装置、系统、设备及介质
智能终端 车载终端 加密方法 密钥 计算机可执行程序
2
一种面向医疗数据异构性的患者相似度动态融合方法
动态融合方法 字段 患者 异构 数据
3
一种大数据驱动的电网新能源调度管理系统及方法
分布式新能源发电 电力需求量 分布式新能源电力 调度管理方法 电力调度管理
4
验证码的生成、验证方法、装置、设备及存储介质
特征值 验证终端 验证码生成方法 字符 验证方法
5
一种基于块的全景图像生成方法
全景图像生成方法 图像块 球面 纹理特征 上采样
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号