一种基于视觉和语言的X光片分析方法及装置

正文

推荐专利

申请号：CN202510463454

申请日期：2025-04-14

公开号：CN120411702A

公开日期：2025-08-01

类型：发明专利

摘要

本申请属于计算机视觉技术领域，具体公开了一种基于视觉和语言的X光片分析方法及装置，方法包括利用视觉编码器提取待分析X光片的图像特征，并利用文本编码器提取待分析X光片的文本特征；获取可学习的查询向量，将所述图像特征、文本特征以及查询向量输入至训练好的大语言模型中，通过所述大语言模型的注意力层对查询向量、图像特征以及文本特征进行跨模态交互，得到融合后的跨模态特征；基于所述跨模态特征进行识别分析，得到待分析X光片图像和文本的分析结果。通过本申请，可提高X光片分析结果的准确性。

技术关键词

大语言模型分析方法跨模态注意力图像文本编码器模态特征预训练模型计算机视觉技术报告可读存储介质存储计算机程序特征提取模块数据处理器分析装置存储器线性

系统为您推荐了相关专利信息

自监督学习的红外目标检测方法、装置、设备及存储介质

监督学习模型编码器特征提取网络训练集生成红外图像

一种基于改进DeepLabV3+的堤坝灾害点识别方法

点识别方法堤坝通道注意力机制空间金字塔池化图像分割

基于对比学习和交叉注意力机制的神经肽鉴别方法及系统

交叉注意力机制输出特征双向长短期记忆网络鉴别方法多头注意力机制

一种数据增强方法和装置

文本大语言模型句法结构主题网络安全技术

占道施工检测方法、系统、设备、介质和程序产品

施工检测方法融合特征分支样本基础

一种基于视觉和语言的X光片分析方法及装置

站点导航

APP 下载