基于视觉-语言大模型的经食道医疗图像分析系统及方法

正文

推荐专利

申请号：CN202411935389

申请日期：2024-12-26

公开号：CN120108683A

公开日期：2025-06-06

类型：发明专利

摘要

本发明涉及医疗图像处理技术领域，特别涉及基于视觉‑语言大模型的经食道医疗图像分析系统，包括：自然语言文本生成模块，用于将输入的经食道医疗图像进行识别并生成与图像相关的文本提示数据；文本提示处理模块，用于对所述文本提示数据进行处理，提取文本提示数据中的关键信息，并构建一个关键信息库数据；多模态大模型学习模块，用于将所述关键信息库数据与经食道医疗图像进行跨模态关联学习，输出对经食道医疗图像的分析结果。该模型通过同时处理图像和相应的文本提示融合学习，能够理解图像中的特征与文本提示之间的对应关系，从而输出精确的经食道医疗图像分析结果，有效减少了医生在图像分析过程中的工作负担，显著提升了诊断效率。

技术关键词

图像分析系统图像分析方法跨模态关联学习自然语言文本视觉特征多模态数据医疗图像处理技术文本编码器序列模块特征提取器对象解码参数分词

系统为您推荐了相关专利信息

动作指令序列生成方法、装置、设备及介质

指令序列生成方法强化学习模型环境状态信息多模态传感器障碍物

通用视觉目标定位方法、装置、电子设备及存储介质

查询特征跨模态定位方法解码模块特征提取模块

一种施工文件数据对齐处理方法、电子设备及存储介质

语句表格文字特征数据对齐技术标记

一种基于多模态大语言模型的智能审图方法及系统

工程设计图纸大语言模型审图方法多模态语义

多模态知识图谱补全模型训练方法、补全方法及设备

多模态模型训练方法实体图像块视觉特征提取

基于视觉-语言大模型的经食道医疗图像分析系统及方法

站点导航

APP 下载