一种基于上消化道时序信息的部位识别方法

正文

推荐专利

一种基于上消化道时序信息的部位识别方法

申请号：CN202510941944

申请日期：2025-07-09

公开号：CN120853218A

公开日期：2025-10-28

类型：发明专利

摘要

一种基于上消化道时序信息的多模态MLKNet识别方法，通过图像‑文本对齐方式为胃镜部位图像生成时序特征向量，利用多尺度分级融合策略将时序信息融合到单帧图像中，特征融合网络采用三向扫描Mamba和大卷积核模块，使时序信息扩展到全图像并增大感受野。数据集经预处理、添加时序描述后划分为训练集和验证集，预训练语义编码器，构建图像编码网络，进行图像‑文本特征对齐，计算包含多种损失的输出损失并反向传播更新参数。本发明增强了相似特征图像区分度，提高了对形变特征分类的鲁棒性。

技术关键词

识别方法输出特征时序特征文本融合图像特征特征融合网络胃镜图像融合特征多尺度特征模块图像类别预训练语言模型交叉注意力机制解码器图像编码器双线性插值多层感知器融合策略

系统为您推荐了相关专利信息

一种基于YOLOv5的小目标识别方法及系统

识别方法协同注意力特征金字塔数据金字塔特征

一种数据迁移方法、装置、电子设备和存储介质

深度学习模型数据迁移方法时序卷积神经网络时序特征样本

一种基于AI大模型架构的混合语音识别方法及系统

混合语音识别方法音频分块文本解码模型缓存技术

油气田常规修井作业工作状况分类方法

修井作业编码向量后文双向注意力分类方法

基于情感识别的AI交互方法、装置、电子设备及存储介质

交互方法数据策略多模态情感类别

一种基于上消化道时序信息的部位识别方法

站点导航

APP 下载