摘要
本发明公开了一种多模态的医学图像异常检测方法、介质和设备,神经网络模型在训练时,基于大语言模型和模板生成文本描述数据集,通过学习文本之间的潜在距离和关系来隐式优化区间边界,区分正常文本描述提示区间和异常提示文本区间,筛选出更加精确的文本描述数据集,从而缓解语义歧义问题。此外,本申请还引入注意力机制,在不改变预训练模型原有的架构的基础上,获取到图像视觉特征的局部特征,并使用多层适配器对视觉语言模型进行微调,以适应医学图像异常检测的需要。通过计算得到的视觉特征和文本特征得到基于全局的异常分数和局部的异常图实现异常检测与分割。
技术关键词
图像异常检测方法
医学
神经网络模型
适配器
样本
计算机程序指令
数据
嵌入特征
文本编码器
多模态
大语言模型
图像处理函数
错误检测
图像视觉特征
引入注意力机制
图像接收模块
异常检测系统
系统为您推荐了相关专利信息
气量预测方法
深层页岩
裂隙网络
动态变化数据
时间序列特征
自动计算方法
供配电系统
深度神经网络模型
短路
组态界面
资源优化方法
PUCCH信道
深度强化学习模型
深度强化学习算法
物理上行控制信道