一种多模态信息增强的水下鱼类图像语义分割方法

AITNT
正文
推荐专利
一种多模态信息增强的水下鱼类图像语义分割方法
申请号:CN202510516088
申请日期:2025-04-23
公开号:CN120411512A
公开日期:2025-08-01
类型:发明专利
摘要
本发明涉及水生态监测技术领域,公开了一种多模态信息增强的水下鱼类图像语义分割方法,具体包括:基于图像编码器和文本编码器,分别图像特征和文本特征,通过初始微调和联合微调策略结合低秩自适应技术微调图像编码器和文本编码器;提取颜色特征、纹理特征、形状特征,生成综合特征;基于图像嵌入、前景嵌入和背景嵌入计算目标得分,生成加权特征;进行多尺度特征上采样、上下文信息增强及SAM模型优化,生成水下鱼类图像的最终语义分割结果。本发明通过结合弱监督学习和多通道注意力机制,显著提升了对水下鱼类图像的分割精度和效率。
技术关键词
图像语义分割方法 多模态信息 文本编码器 图像编码器 Gabor滤波器 颜色直方图 纹理特征 图像嵌入 加权特征 注意力机制 水生态监测技术 边缘检测 融合特征 多尺度特征融合
系统为您推荐了相关专利信息
1
一种基于超声和视觉的多模态缺陷检测方法
缺陷检测方法 超声数据 金属产品表面 超声信号 频谱分析方法
2
一种双模信息增强的图像融合方法、系统及设备
图像融合方法 可见光图像 Gabor滤波器 高频特征 信息处理
3
一种面向林业垂直领域的语言大模型构造方法
模型构造方法 图像编码 多模态 林业 矩阵
4
一种区分缺陷的纺织提花检测系统及方法
区分缺陷 多模态数据融合 光谱成像 纹理特征提取 提花织物
5
一种文本对齐的人体运动生成方法及系统
运动生成方法 序列 重建人体 标记 文本编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号