摘要
本申请实施例属于图像信息识别技术领域,应用于医学影像信息识别及文本化描述场景中,涉及一种图像信息识别方法、装置、设备及其存储介质,包括获取需进行信息识别的原医学影像;对预处理后的医学影像进行医学影像视觉特征提取;将医学影像视觉特征经预设的线性投影层映射到目标语言嵌入空间,获取语言嵌入向量表示;根据语言嵌入向量表示编码生成原医学影像对应的目标医学信息;通过多模态医学信息生成模型输出目标医学信息,完成对原医学影像的图像信息识别。通过将所述图像信息识别方法使用到医学影像信息识别中,能够采用人工智能方式识别医学影像信息,减少医务工作者的医学影像分析时间,且更加准确,降低了医务工作者的误判风险。
技术关键词
图像信息识别方法
视觉特征提取
图像特征向量
医学影像信息
计算机可读指令
多模态融合技术
文本
图像信息识别技术
网络结构
线性
信息编码
信息识别装置
可读存储介质
多尺度特征
解码
系统为您推荐了相关专利信息
电源管理状态
电源管理方法
芯片
生成电源
电源控制
图像特征向量
状态识别方法
图像特征提取模型
文本特征向量
训练样本集
代码切片
缓冲区溢出漏洞
大语言模型
样本
计算机可读指令
恶意软件识别
模型训练方法
计算机可读指令
优化器
模型训练装置