基于多尺度特征融合与问题增强的医学视觉问答方法

正文

推荐专利

申请号：CN202510335262

申请日期：2025-03-20

公开号：CN120316281A

公开日期：2025-07-15

类型：发明专利

摘要

本发明提供了一种基于多尺度特征融合与问题增强的医学视觉问答方法，包括：获取待识别医学图像和待回答文本；将待识别医学图像和待回答文本输入预训练的医学问答模型，得到关于待回答文本的检测结果；检测结果为文本结果；其中，预训练的医学问答模型设置有视觉提取模型、文本提取模型以及分类模型；视觉提取模型为基于多尺度视觉特征提取、多尺度视觉特征增强以及多尺度视觉特征融合方法的视觉模型；视觉提取模型与文本提取模型之间设置有多头交叉注意力的特征交互机制。通过结合预训练的医学问答模型中的视觉提取模型、文本提取模型以及分类模型，提高了医学图像的理解能力，最终整体上提升了医学视觉问答任务的识别精度和回答质量。

技术关键词

多尺度特征融合识别医学图像视觉问答方法问答模型文本融合特征视觉特征提取交互机制融合方法机器可读指令去噪自动编码器问答装置交叉注意力机制多头注意力机制模块

系统为您推荐了相关专利信息

音视频数据处理方法

文本识别神经网络模型语音识别模型视频帧人脸数据库

基于多模态动态面部表情的帕金森病辅助诊断方法及系统

动态面部表情辅助诊断方法视觉特征提取多模态文本

基于多模态数据的火电厂设备故障预测方法及系统

火电厂设备故障火电厂循环水系统关键词文本特征向量信号随时间

生成推送信息的方法及装置

生成推送信息场景特征大语言模型网络样本

一种基于多模态特征的图纸数据提取方法

重构误差数据提取方法多模态特征连续型数据图纸

基于多尺度特征融合与问题增强的医学视觉问答方法

站点导航

APP 下载