一种基于特征增强和多尺度特征融合的医疗票据图像文本检测方法

正文

推荐专利

申请号：CN202411083092

申请日期：2024-08-08

公开号：CN118887685A

公开日期：2024-11-01

类型：发明专利

摘要

本发明涉及一种基于特征增强和多尺度特征融合的医疗票据图像文本检测方法，该方法融合了高效的分割模块和可学习的后处理模块，并通过引入视觉语言预训练模型来增强检测方法的性能；其中，分割模块包括特征增强模块和多尺度特征融合模块，用于增强模型的泛化性和鲁棒性；后处理模块采用了可微分的二值化方法，能够自适应地设置阈值，从而改善文本检测的效果；预训练模块引入了视觉语言预训练模型，使得模型获得丰富的视觉和语义表征能力。本发明可以有效提高其文本检测的速度和精度，也为后续更加复杂的医疗场景下的文本检测算法研究以及工程应用提供了新的思路。

技术关键词

图像文本检测方法预训练模型票据多尺度特征融合后处理模块多层次特征提取视觉文本检测模型图像解码器注意力网络金字塔医疗场景通道鲁棒性语义

系统为您推荐了相关专利信息

基于多模态多尺度的弱监督图像篡改检测定位方法和系统

多模态多尺度特征融合图像篡改检测分支融合特征

一种分布式电力计量实时检测与故障预警系统

分布式供电设备故障预警系统分布式电力异常事件故障特征

基于深度学习与生成式人工智能的塔机吊装方案生成系统

生成系统输入模块预训练模型输出模块 RNN模型

基于多模态扩散模型的视觉诱发脑信号解码方法及系统

信号解码方法视觉诱发脑语义特征多模态重建高分辨率图像

一种用于冰箱化霜降噪应用自动化测试系统、方法及储存介质

自动化测试方法自动化测试系统设备运行状态生成控制指令数据分析模块

一种基于特征增强和多尺度特征融合的医疗票据图像文本检测方法

站点导航

APP 下载