一种视觉语言模型的医疗图像分析方法、装置及存储介质

正文

推荐专利

申请号：CN202510318097

申请日期：2025-03-18

公开号：CN120259695A

公开日期：2025-07-04

类型：发明专利

摘要

本发明涉及一种视觉语言模型的医疗图像分析方法、装置及存储介质，涉及视觉语言模型医疗图像分析技术领域。本发明针对数据集中的每个图像，利用第一文本编码器提取其疾病实体中每个元素的元素嵌入向量，计算每个元素嵌入向量和全部参考元素嵌入向量之间的余弦相似性；将任意图像的全部疾病实体的余弦相似度矩阵进行最大池化处理，投影成维度为1×参考元素数量的图像标签；将全部图像的图像标签拼接得到医学影像诊断报告中全部图像和全部参考元素之间的相似度矩阵；损失函数包含相似度矩阵预测约束和掩码预测约束，训练视觉语言模型，提高准确度；应用时，取视觉语言模型中训练完成的图像编码器和第二文本编码器进行医疗图像分析任务。

技术关键词

医学影像诊断报告图像分析方法文本编码器疾病图像编码器实体图像解码器图像嵌入大语言模型视觉元素矩阵医疗图像分类存储计算机程序图像分析装置处理单元

系统为您推荐了相关专利信息

一种miRNA与疾病多维关系预测的计算方法

工作特征多层感知机疾病计算方法统计学方法

一种基于生成式AI大模型的语义通信方法、装置、设备及存储介质

文本生成模型图像重建语义像素文本编码器

面向多模态生成任务的对抗样本生成方法及设备

样本生成方法多模态图像嵌入非暂态计算机可读存储介质生成机制

一种基于AI疾病模拟模型的结核病数据管理控制系统

数据管理控制系统模拟模型数据管理中心患者疾病

基于AI大模型的医药知识图谱的智能客服实现方法

医药知识图谱智能客服问答对数据语义验证机制

一种视觉语言模型的医疗图像分析方法、装置及存储介质

站点导航

APP 下载