摘要
本发明公开了一种基于文本内核和文本聚簇的中文手写体检测方法及系统,该方法包括:获取中文手写体文本图像;提取中文手写体文本特征图,进行通道数的调整,使每个特征图的通道数相统一;通过上采样操作将深层特征逐步回复到更高分辨率,并与对应尺度的浅层特征进行融合;动态地融合不同尺度的特征图;学习文本像素之间的相似度向量,将文本像素聚合到对应的文本核上;使用预测的相似度向量来指导文本像素的聚合;将文本区域损失、文本核损失和文本聚簇损失加入到模型训练中,利用梯度下降算法进行迭代,直至达到最大迭代次数或模型收敛。本发明通过上述技术方案,融合文本内核预测与动态像素聚簇技术,有效提升了文本检测精度与鲁棒性。
技术关键词
文本
内核
梯度下降算法
上采样
特征提取模块
通道
分辨率
动态地
多尺度
像素点
注意力机制
元素
采样模块
多尺寸
处理器
网络
鲁棒性
系统为您推荐了相关专利信息
智能轮椅控制方法
脑电特征
意图分类模型
控制轮椅
电信号
图谱构建方法
医学
文本
实体识别模型
联合损失函数
业务分析方法
数据关联信息
数据挖掘模型
指标
场景