基于视觉语言特征对比的胸部DR影像报告生成方法

AITNT
正文
推荐专利
基于视觉语言特征对比的胸部DR影像报告生成方法
申请号:CN202411045347
申请日期:2024-08-01
公开号:CN119069063B
公开日期:2025-09-09
类型:发明专利
摘要
本发明公开了一种基于视觉语言特征对比的胸部DR影像报告生成方法,首先,获取含有病变及无病变实例的胸部DR影像及对应报告构成训练数据集的锚实例、正实例和负实例;然后,通过卷积神经网络提取每个实例影像的卷积序列特征,进而得到视觉编码特征;随后,将锚实例、正实例、负实例分别进行编码获取语言编码特征;进一步地,将含有病变实例与无病变实例的锚实例、正实例和负实例的视觉编码特征和语言编码特征进行对比来优化网络;最后,在测试阶段仅需将影像的视觉编码特征输入文本生成解码器就可生成报告。本发明可以有效地通过对比不同实例间的视觉特征和语言特征来增强模型对于病变的表征,从而提升病变实例报告生成的性能。
技术关键词
影像报告生成方法 编码特征 注意力 视觉特征 文本 卷积神经网络提取 序列特征 解码器 生成报告 表达式 优化网络参数 矩阵 数据 卷积特征 生成方式
系统为您推荐了相关专利信息
1
一种基于关联知识图谱查询路径的方法、装置、介质及设备
知识图谱查询 三元组 知识图谱数据 语句 分词
2
车道线跟踪方法、电子设备、存储介质及车辆
车道线跟踪方法 图像 线结构 卷积循环神经网络 非极大值抑制方法
3
一种交通场景图像数据分析及目标分割的方法及装置
交通场景图像 螺旋视觉 空间模块 扫描策略 解码器
4
一种基于人工智能的移动机器人语音数据控制方法及系统
数据控制方法 语音特征 移动机器人 语音识别文本 运动补偿
5
基于大语言模型的移动电商虚假评论检测方法和系统
虚假评论检测方法 大语言模型 文本 电商 主题分布特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号