摘要
本发明涉及深度学习、自然语言处理、跨模态对齐、图像字幕等技术,并公开了一种基于周期性跨模态对齐的医学影像报告生成方法。该方法构建图像文本对应关系,并采用自适应注意因子,通过多层感知器学习和改进单词与图像区域之间的对应关系。同时使用相似度得分评估每个单词的重要性,确保模型能够更好地选择和加权单词,以提高报告生成的质量。在此基础上,模型引入了循环周期,允许模型多次迭代对齐操作,以进一步提高模型性能。最终,将循环跨模态对齐更新后的文本特征与图像特征拼接,用于生成医学报告。本发明的技术方案弥合了医学影像报告生成领域的视觉与语言之间的鸿沟,为解决这一难题提供了一种创新方法。
技术关键词
报告生成方法
跨模态
周期性
视觉特征提取
文本
图像
特征提取器
生成医学报告
医学影像特征
编码器解码器
解码器框架
注意力
输入解码器
多层感知器
多模态
对齐方法
动态更新
系统为您推荐了相关专利信息
群体识别方法
网络用户
关系
节点
异常用户识别方法
智能报告生成方法
大语言模型
生成报告
模式
报告生成系统