基于语义感知交互的场景文本图像超分辨率方法及系统

AITNT
正文
推荐专利
基于语义感知交互的场景文本图像超分辨率方法及系统
申请号:CN202411942172
申请日期:2024-12-27
公开号:CN119359548B
公开日期:2025-06-03
类型:发明专利
摘要
本发明属于计算机图像处理技术领域,公开了一种基于语义感知交互的场景文本图像超分辨率方法及系统,包括采集图像;对图像进行分割操作,获得文本区域,对其进行特征提取,获得文本区域特征,对文本区域进行映射操作,对映射后的文本区域进行筛选,对筛选后的文本区域进行操作,获得文本概率序列,基于文本概率序列获得文本概率特征;提取图像特征,对图像特征和文本区域特征进行信息交换,将信息交换后的两个特征相加,得到交互融合后的特征,基于交互融合后的特征和文本概率特征获得超分辨率图像;定义损失函数,优化模型参数。本有效解决了在高噪声条件下文本定位和处理不精准的问题,能够更好的适应不断变化的分辨率图像。
技术关键词
场景文本图像 超分辨率方法 交叉注意力机制 语义 特征金字塔网络 分割器 序列 模型训练模块 噪声条件 处理器 多模态 分支 计算机程序产品 像素
系统为您推荐了相关专利信息
1
一种基于声热多模态融合成像的方法、装置及系统
成像特征 热成像 工业设备 跨模态 超声图像数据
2
基于大语言模型的设备状态时间序列异常检测方法及系统
大语言模型 滑动窗口 适配器 序列 对齐模块
3
一种基于大数据的英语教学课堂互动模式分析方法
模式分析方法 转移概率矩阵 轮廓系数 HMM模型 大数据
4
一种基于代码简化的软件漏洞评估优化方法
评估优化方法 语句 程序切片 对源代码 关键词
5
一种开放式航电架构的冲突消解方法
冲突消解方法 实体 语义 规则推理引擎 智能冲突检测
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号