摘要
本发明提供一种基于疾病状态检索提示的多视角胸片报告生成方法。本发明使用多模态语言模型作为文本生成解码器,使用医学图像编码器编码正位胸片影像和侧位胸片影像,将编码后的图像特征进行融合作为多模态语言模型的图像输入,并将检索得到的疾病状态信息进行融合作为多模态语言模型的文本输入,两者共同驱动报告生成过程。本发明有效地结合了正位胸片与侧位胸片的互补信息,在细粒度特征捕捉方面有更高的准确性。本发明通过对检索到的疾病状态信息分配权重并加权融合,提示信息既能保留多样化的临床语义,又能更好地突出与当前胸片影像密切相关的部分,有效降低了无关或噪声信息对报告生成的干扰。
技术关键词
报告生成方法
多模态
疾病
图像编码器
多视角
文本编码器
影像
实体
生成报告
交叉注意力机制
细粒度特征
生成机制
大语言模型
噪声信息
标签
系统为您推荐了相关专利信息
匹配推荐方法
服务效能
检测机构
建立匹配模型
多模态
注意力
场景理解方法
动态特征选择
可见光
语义分割网络
混合学习模型
故障诊断方法
多模态
采集控制器
能量分布特征
机械故障诊断方法
诊断机械设备
故障诊断模型
多模态
多输入单输出
智能路灯系统
环境感知设备
多模态
路段
分析方法