一种基于多任务建模的医学视觉问答方法及系统

正文

推荐专利

申请号：CN202411711397

申请日期：2024-11-27

公开号：CN119202334B

公开日期：2025-05-06

类型：发明专利

摘要

本发明公开了一种基于多任务建模的医学视觉问答方法及系统，方法包括对待分析的医学图像采用视觉编码器进行特征抽取，得到图像特征，将初步问题指令与历史问答数据输入对话大模型生成问题指令，经文本编码器得到文本特征；将所得到的文本特征和图像特征进行特征融合，经过自注意力图像重要性加权处理及图文对齐，得到图文融合表征；再输入多目标输出投影层，进行多任务预测，输出包括问题回答、图像类别、重要区域掩码，将问题回答、图像类别输入对话大模型，结合对话上下文和多轮互动数据，结合重要区域掩码最终生成具有详细说明的诊断意见。本发明提升了交互体验以及问答系统的性能，有助于在多模态复杂信息中进行更为精确的医学诊断。

技术关键词

视觉问答方法图像类别多任务文本编码器图文注意力跨模态医学图像特征提取加权特征医学图像分割模型图像编码器指令层级级联问答系统生成图像特征矩阵

系统为您推荐了相关专利信息

一种基于元强化学习的星地融合网络路由方法及系统

网络拓扑结构强化学习算法生成网络拓扑多任务在线

视频检索方法、装置、计算机设备及存储介质

视频检索方法视频编码器文本编码器多模态特征样本

乳腺癌HER2蛋白表达对照区域的智能识别量化方法、装置、设备及存储介质

染色多任务强度特征点计算机执行指令

一种快慢系统协同工作的数据标注系统

数据标注系统多模态特征融合语言编码器输出模块文本特征向量

一种高空电力作业安全设备违规佩戴智能检测方法

高空电力作业智能检测方法安全设备速差自锁器语义

一种基于多任务建模的医学视觉问答方法及系统

站点导航

APP 下载