摘要
本发明公开了一种轻量级空间适配器增强的医学报告生成方法。本发明步骤:1、全局视觉编码器提取全局空间特征。2、空间适配器:将来自卷积骨干网络的局部空间特征与来自视觉Transformer的全局特征通过空间适配器中的空间注入器和特征提取器进行多轮迭代更新,获取与报告生成最相关的视觉信息。3、构建跨媒体预训练:用于更好地对齐图像和文本模态。4、构建报告解码器,利用空间适配器输出的视觉特征,来生成医学图像诊断报告。本发明能够正确且有效地理解医学图像的内容,并准确地捕捉到图像中的异常区域,同时构建轻量级且高效的跨媒体医学报告生成框架,从而提升答案预测的准确性。且在更少的可训练参数量下,得到与现有方法相当甚至更好的结果。
技术关键词
报告生成方法
适配器
生成医学图像
注意力
特征提取器
解码器
补丁
文本
融合视觉特征
局部空间特征
多模态
标记
生成框架
预训练模型
嵌入特征
系统为您推荐了相关专利信息
三维重建方法
三维重建图像
特征金字塔网络
权重分配策略
弱纹理区域
土地利用分类方法
交叉注意力机制
特征融合网络
融合特征
数据
废气监测方法
过滤模块
备用过滤装置
监控模块
检测传感器
上下文语义信息
视觉推理
电路板外观
特征提取器
图像