一种基于周期性跨模态对齐的医学影像报告生成方法

正文

推荐专利

申请号：CN202410870943

申请日期：2024-06-28

公开号：CN118866225A

公开日期：2024-10-29

类型：发明专利

摘要

本发明涉及深度学习、自然语言处理、跨模态对齐、图像字幕等技术，并公开了一种基于周期性跨模态对齐的医学影像报告生成方法。该方法构建图像文本对应关系，并采用自适应注意因子，通过多层感知器学习和改进单词与图像区域之间的对应关系。同时使用相似度得分评估每个单词的重要性，确保模型能够更好地选择和加权单词，以提高报告生成的质量。在此基础上，模型引入了循环周期，允许模型多次迭代对齐操作，以进一步提高模型性能。最终，将循环跨模态对齐更新后的文本特征与图像特征拼接，用于生成医学报告。本发明的技术方案弥合了医学影像报告生成领域的视觉与语言之间的鸿沟，为解决这一难题提供了一种创新方法。

技术关键词

报告生成方法跨模态周期性视觉特征提取文本图像特征提取器生成医学报告医学影像特征编码器解码器解码器框架注意力输入解码器多层感知器多模态对齐方法动态更新

系统为您推荐了相关专利信息

一种智能体框架下的多模态智能体交互方法及系统

智能体交互知识库管理框架智能家居场景文本

基于多关系图特征的网络用户特定群体识别方法

群体识别方法网络用户关系节点异常用户识别方法

多模态内容智能审核与违规检测方法及系统

违规检测方法多模态文本关键帧跨模态

一种虚拟化产品的文档转换方法、装置及设备

虚拟化产品文档转换方法字典简体格式

一种基于大语言模型的智能报告生成方法

智能报告生成方法大语言模型生成报告模式报告生成系统

一种基于周期性跨模态对齐的医学影像报告生成方法

站点导航

APP 下载