基于视觉协同增强和跨模态融合网络的放射学报告生成方法及系统

正文

推荐专利

申请号：CN202510732129

申请日期：2025-06-03

公开号：CN120853786A

公开日期：2025-10-28

类型：发明专利

摘要

本发明公开了基于视觉协同增强和跨模态融合网络的放射学报告生成方法及系统，属于自然语言处理的技术领域。本发明设计了一个视觉协同增强模块分别从全局和局部视角对视觉特征进行建模，以增强对放射学图像中异常病变的识别，从而缓解因数据分布不平衡而导致的对异常区域的注意力偏差。同时，提出了一个跨模态信息融合器，该模块利用一个新颖的双重跨模态通信组件去促进视觉和文本信息的多级融合，解决模态异构问题，实现语义级特征对齐和细化。本发明解决了放射学图像中数据分布不平衡导致模型无法捕获关键的病灶特征的问题，以及图像和文本信息不同模态信息的特征空间存在差异性，难以有效对齐和融合的问题。

技术关键词

全局视觉特征跨模态局部视觉特征电子病历数据识别医学图像注意力机制报告生成方法文本通信组件编码器模块训练卷积神经网络共享存储单元报告生成系统深度神经网络模型

系统为您推荐了相关专利信息

基于神经网络的生物有机肥菌种识别方法、系统及设备

生物有机肥融合特征跨模态多模态信息识别方法

一种扫地机器人的控制方法及系统

扫地机器人清扫策略融合注意力机制物体识别地面

基于文本引导半监督伪标签的海洋遥感海岸线分割方法

海洋遥感遥感图像特征标签注意力分割方法

多模态情感识别方法、系统、设备及介质

情感识别方法特征提取模块语谱图前馈神经网络语音特征提取

一种基于二阶段语义矫正的图像字幕算法

解码器交互注意力网格特征视觉特征图像

基于视觉协同增强和跨模态融合网络的放射学报告生成方法及系统

站点导航

APP 下载