基于视觉协同增强和跨模态融合网络的放射学报告生成方法及系统

AITNT
正文
推荐专利
基于视觉协同增强和跨模态融合网络的放射学报告生成方法及系统
申请号:CN202510732129
申请日期:2025-06-03
公开号:CN120853786A
公开日期:2025-10-28
类型:发明专利
摘要
本发明公开了基于视觉协同增强和跨模态融合网络的放射学报告生成方法及系统,属于自然语言处理的技术领域。本发明设计了一个视觉协同增强模块分别从全局和局部视角对视觉特征进行建模,以增强对放射学图像中异常病变的识别,从而缓解因数据分布不平衡而导致的对异常区域的注意力偏差。同时,提出了一个跨模态信息融合器,该模块利用一个新颖的双重跨模态通信组件去促进视觉和文本信息的多级融合,解决模态异构问题,实现语义级特征对齐和细化。本发明解决了放射学图像中数据分布不平衡导致模型无法捕获关键的病灶特征的问题,以及图像和文本信息不同模态信息的特征空间存在差异性,难以有效对齐和融合的问题。
技术关键词
全局视觉特征 跨模态 局部视觉特征 电子病历数据 识别医学图像 注意力机制 报告生成方法 文本 通信组件 编码器 模块 训练卷积神经网络 共享存储单元 报告生成系统 深度神经网络模型
系统为您推荐了相关专利信息
1
基于神经网络的生物有机肥菌种识别方法、系统及设备
生物有机肥 融合特征 跨模态 多模态信息 识别方法
2
一种扫地机器人的控制方法及系统
扫地机器人 清扫策略 融合注意力机制 物体 识别地面
3
基于文本引导半监督伪标签的海洋遥感海岸线分割方法
海洋遥感 遥感图像特征 标签 注意力 分割方法
4
多模态情感识别方法、系统、设备及介质
情感识别方法 特征提取模块 语谱图 前馈神经网络 语音特征提取
5
一种基于二阶段语义矫正的图像字幕算法
解码器 交互注意力 网格特征 视觉特征 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号