摘要
本发明涉及面向胸部放射医学报告生成的跨模态信息增强方法。包括以下步骤:首先,使用视觉特征提取器和文本特征提取器分别提取多尺度影像视觉特征和多尺度报告文本特征;其次,将提取到的多尺度影像视觉特征和多尺度文本特征,通过跨模态对齐模块,来强化视觉‑文本特征的映射关系;然后,将对齐后的特征信息输入到跨模态注意力模块中,获取模式信息并更新存储到记忆矩阵中,从而使跨模态信息进一步增强;最后,采用报告生成模块,将经过编码后的视觉特征和增强后的跨模态信息共同输入到该模块中,生成最终的诊断报告。在医学报告生成公开数据集上得到的实验结果表明,本方法能有效提高医学报告生成的准确性和有效性。
技术关键词
报告
视觉特征提取
影像
文本
注意力
记忆
多尺度
跨模态
矩阵
特征提取器
sigmoid函数
对齐模块
语义特征
解码器
全局平均池化
编码器
三元组
样本
系统为您推荐了相关专利信息
大语言模型
识别方法
多模态特征
梯度下降法
案件
韵律特征
韵律预测模型
文本
情感特征
语音交互方法
语义分割方法
图像特征数据
交叉注意力机制
图像校准
融合特征
数据分类分级
大语言模型
训练集数据
语义向量
BERT模型