摘要
本发明公开了一种基于多模态大模型的硅藻检测方法及系统,涉及法医学检验与计算机视觉交叉技术领域,包括:构建的图像‑文本对训练数据,微调基于Transformer架构的多模态大模型,保留预训练视觉编码器的通用特征提取能力,在文本编码器中注入硅藻形态学领域词典作为可学习嵌入向量,并采用对比学习损失函数优化视觉特征与文本特征的跨模态对齐;再通过知识蒸馏和量化模型后,模型将采集的已知放大倍率的硅藻显微图像,与文本嵌入向量进行空间注意力融合,通过跨模态解码器的自注意力权重筛选机制输出目标矩形框参数,并依据已知的放大倍率,对硅藻的尺寸进行检测计算。本发明为法医学硅藻检验提供了智能化、自动化的新的解决方案。
技术关键词
文本编码器
多模态
损失函数优化
特征提取能力
跨模态
扫描电镜图像
注意力
计算机视觉交叉技术
法医学硅藻检验
视觉特征
标注工具
解码器
词典
蒸馏
检测头
数据
参数
机制
系统为您推荐了相关专利信息
多模态特征
语音特征
面部特征
预警方法
预测特征
角色切换方法
多模态
切换决策机制
动态权重分配
语音特征
视频理解方法
多模态
多层感知器
大语言模型
多阶段
诊断系统
心电信号采集模块
基线校准方法
节点
处理单元