摘要
本申请涉及一种基于文本语言提示的术后病理图像分析方法,该方法首先通过对病理全切片扫描图像进行切割,分别得到多个第一图像块、多个第二图像块;提取各第一图像块的特征,作为局部图像特征;提取并加权求和所有第二图像块的特征,得到全局图像特征;基于全局图像特征与各局部图像特征之间的余弦相似度,融合局部图像特征得到总体图像特征;将待分析的病理全切片扫描图像输入至视觉‑语言多模态大模型,并对输出的整体视觉特征文本描述进行特征提取,得到文本特征;而后融合总体图像特征与文本特征,得到多模态特征;将多模态特征输入分类器,得到各癌症类型的概率分布。该方法为术后病理分析提供了可解释、可交互、跨模态融合的创新解决方案。
技术关键词
局部图像特征
图像分析方法
融合特征
病理图像特征提取
缩略图
注意力
多模态特征
交互特征
图像特征向量
切片
视觉特征
文本编码器
图像块
跨模态
热力图
系统为您推荐了相关专利信息
驻留时间分布
大口径光学元件
预测网络模型
工件
融合特征
图像分割模型
图像分割方法
融合特征
多模态
编码器模块
多传感器阵列
石英晶体微天平传感器
浓度检测系统
金属氧化物半导体传感器
信号预处理模块
输电线路绝缘子
高效检测方法
融合特征评估
像素点
高效检测系统
人脸识别方法
人脸图像数据
多模态
文本编码器
图像编码器