摘要
本发明涉及一种基于提示分割任务的混合监督文本检测方法,包括S1构建包括图像编码器,提示编码器和掩码解码器的混合监督文本检测模型TextSAM,TextSAM采用混合监督的训练模式,其训练数据集包含部分全监督数据集合和部分弱监督数据集合当时,即进行全监督训练;当时,即进行弱监督训练。将一张图像输入训练好的TextSAM,输出即是对该图像的预测标签。经过实验证明混合监督训练模式下,仅使用25%的全监督数据和75%的弱监督数据,TextSAM就能取得接近100%全监督数据时的性能,从而减少对标注数据的依赖。
技术关键词
文本检测方法
标签
教师
图像编码器
文本检测模型
学生
数据
网络
解码器
计算方法
梯度下降法
轮廓
因子
分支
参数
模式
系统为您推荐了相关专利信息
决策树模型
推理方法
节点
全同态加密算法
二叉决策树
痉挛
数据
医疗康复技术
训练预测模型
皮尔逊相关系数
旋转机械设备
故障分类模型
神经网络模型
生成对抗模型
胶囊