摘要
本发明属于计算机图像处理技术领域,公开了一种基于语义感知交互的场景文本图像超分辨率方法及系统,包括采集图像;对图像进行分割操作,获得文本区域,对其进行特征提取,获得文本区域特征,对文本区域进行映射操作,对映射后的文本区域进行筛选,对筛选后的文本区域进行操作,获得文本概率序列,基于文本概率序列获得文本概率特征;提取图像特征,对图像特征和文本区域特征进行信息交换,将信息交换后的两个特征相加,得到交互融合后的特征,基于交互融合后的特征和文本概率特征获得超分辨率图像;定义损失函数,优化模型参数。本有效解决了在高噪声条件下文本定位和处理不精准的问题,能够更好的适应不断变化的分辨率图像。
技术关键词
场景文本图像
超分辨率方法
交叉注意力机制
语义
特征金字塔网络
分割器
序列
模型训练模块
噪声条件
处理器
多模态
分支
计算机程序产品
像素
系统为您推荐了相关专利信息
模式分析方法
转移概率矩阵
轮廓系数
HMM模型
大数据
冲突消解方法
实体
语义
规则推理引擎
智能冲突检测