一种基于多模态动态引导与拓扑的蔗尾实时计数方法

AITNT
正文
推荐专利
一种基于多模态动态引导与拓扑的蔗尾实时计数方法
申请号:CN202510373584
申请日期:2025-03-27
公开号:CN120339201A
公开日期:2025-07-18
类型:发明专利
摘要
本发明涉及图像处理领域,尤其是一种基于多模态动态引导与拓扑的蔗尾实时计数方法,包括获取蔗尾的原始图像;对原始图像进行多模态编码;提取预处理图像的多尺度特征,且在通道维度进行拼接,以获得预测密度图;对预测密度图进行分块后计算持续同调特征及拓扑特征融合,以生成空间注意力权重图:通过转置卷积生成初始密度图,对初始密度图进行物料约束以获得约束密度图,对约束密度图进行滤波后进行像素级累加,以输出当前帧的蔗尾总数;采集多张工业现场图像,且构建多模态数据集;构建初始计数模型并进行模型训练。本发明能够同步提升复杂光照下的颜色混淆抑制能力、密集遮挡区域的分布合理性及工业场景下的蔗尾计数精度。
技术关键词
计数方法 多模态 密度 图像 拓扑特征 注意力 坐标 文本编码器 拓扑微调 动态 像素 语义向量 分块 工业现场 编码方法 文本特征向量 滤波 自然语言
系统为您推荐了相关专利信息
1
一种基于全局信息增强的脱离上下文虚假信息检测方法
虚假信息检测方法 三元组 编码特征 预训练语言模型 语义
2
雷达的参数优化方法、装置、终端及存储介质
异常信号 参数优化方法 信号检测灵敏度 构建三维场景 特征数据库
3
一种基于深度学习的人才推荐方法
人才推荐方法 BERT模型 学生 教师 文本
4
像素点的颜色值的确定方法、装置、设备及介质
像素点 神经网络模型 光线追踪算法 亮度 颜色
5
一种虚拟现实场景互动方法及系统
虚拟现实场景 互动场景 互动方法 图像纹理特征提取 三维图像处理技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号