摘要
本发明涉及图像处理领域,尤其是一种基于多模态动态引导与拓扑的蔗尾实时计数方法,包括获取蔗尾的原始图像;对原始图像进行多模态编码;提取预处理图像的多尺度特征,且在通道维度进行拼接,以获得预测密度图;对预测密度图进行分块后计算持续同调特征及拓扑特征融合,以生成空间注意力权重图:通过转置卷积生成初始密度图,对初始密度图进行物料约束以获得约束密度图,对约束密度图进行滤波后进行像素级累加,以输出当前帧的蔗尾总数;采集多张工业现场图像,且构建多模态数据集;构建初始计数模型并进行模型训练。本发明能够同步提升复杂光照下的颜色混淆抑制能力、密集遮挡区域的分布合理性及工业场景下的蔗尾计数精度。
技术关键词
计数方法
多模态
密度
图像
拓扑特征
注意力
坐标
文本编码器
拓扑微调
动态
像素
语义向量
分块
工业现场
编码方法
文本特征向量
滤波
自然语言
系统为您推荐了相关专利信息
虚假信息检测方法
三元组
编码特征
预训练语言模型
语义
异常信号
参数优化方法
信号检测灵敏度
构建三维场景
特征数据库
虚拟现实场景
互动场景
互动方法
图像纹理特征提取
三维图像处理技术