一种基于上消化道时序信息的部位识别方法

AITNT
正文
推荐专利
一种基于上消化道时序信息的部位识别方法
申请号:CN202510941944
申请日期:2025-07-09
公开号:CN120853218A
公开日期:2025-10-28
类型:发明专利
摘要
一种基于上消化道时序信息的多模态MLKNet识别方法,通过图像‑文本对齐方式为胃镜部位图像生成时序特征向量,利用多尺度分级融合策略将时序信息融合到单帧图像中,特征融合网络采用三向扫描Mamba和大卷积核模块,使时序信息扩展到全图像并增大感受野。数据集经预处理、添加时序描述后划分为训练集和验证集,预训练语义编码器,构建图像编码网络,进行图像‑文本特征对齐,计算包含多种损失的输出损失并反向传播更新参数。本发明增强了相似特征图像区分度,提高了对形变特征分类的鲁棒性。
技术关键词
识别方法 输出特征 时序特征 文本 融合图像特征 特征融合网络 胃镜图像 融合特征 多尺度特征 模块 图像类别 预训练语言模型 交叉注意力机制 解码器 图像编码器 双线性插值 多层感知器 融合策略
系统为您推荐了相关专利信息
1
一种基于YOLOv5的小目标识别方法及系统
识别方法 协同注意力 特征金字塔 数据 金字塔特征
2
一种数据迁移方法、装置、电子设备和存储介质
深度学习模型 数据迁移方法 时序卷积神经网络 时序特征 样本
3
一种基于AI大模型架构的混合语音识别方法及系统
混合语音识别方法 音频分块 文本 解码模型 缓存技术
4
油气田常规修井作业工作状况分类方法
修井作业 编码向量 后文 双向注意力 分类方法
5
基于情感识别的AI交互方法、装置、电子设备及存储介质
交互方法 数据 策略 多模态 情感类别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号