摘要
本申请实施例提供了一种图像信息提取方法、装置、计算机设备及存储介质,涉及人工智能技术领域和数字医疗领域。方法包括:将原始图像分割为多个子图像,并确定每个子图像对应的目标图像特征;确定原始图像对应的描述文本,以及确定描述文本对应的目标文本特征;将目标文本特征分别和每个目标图像特征拼接得到每个子图像对应的目标图文特征;将目标图文特征和目标图像特征输入到训练后的解码模型中,输出与描述文本相关的目标子图像;根据目标子图像提取出描述文本对应的实体,其中训练后的解码模型基于预测子样本图像和标签子图像之间对应的损失训练得到。本申请实施例能够提高对图像中实体进行提取的准确性。
技术关键词
图像信息提取方法
解码模型
文本
注意力模型
样本
图文
训练卷积神经网络
图像信息提取装置
图像分割
编码
实体
计算机设备
可读存储介质
人工智能技术
标签
处理器
拼接模块
输入模块
系统为您推荐了相关专利信息
副本
域名解析系统
解析器
数据同步
计算机程序指令
运动特征
融合特征
视频帧
全景视频生成方法
文本
误差状态评估方法
互感器
朴素贝叶斯分类器
数据
附加误差