摘要
本发明实施例中提供了一种基于医学影像报告的多模态教学知识图谱构建方法,属于数据处理技术领域,具体包括:得到文本实体和关系;得到视觉特征,得到文本特征;利用线性层将视觉和文本特征映射到相同维度的特征空间,将映射后的特征拼接并加入一个可学习的嵌入;根据影像报告跨模态实体对齐模型对于真实标签预测损失的梯度反馈进一步迭代解剖标签生成器的参数;通过对比学习训练影像报告跨模态实体对齐模型;将学习到的嵌入输入训练好的影像报告跨模态实体对齐模型的预测模块,标记出影像图片中文本实体对应的视觉实体区域;根据视觉实体区域、文本实体和关系构建多模态知识图谱。通过本发明的方案,提高了构建效率、精准度和泛化性能。
技术关键词
实体对齐模型
跨模态
文本
影像
视觉特征
报告
知识图谱构建方法
标签
令牌
跨度
图片
样本
实体关系抽取模型
序列
ResNet网络
多模态
坐标
位置编码信息
系统为您推荐了相关专利信息
聆听方法
语音识别模型
社交媒体平台
实时语音
多语言
训练机器人
机器人示教方法
指令
示教器
机器人示教装置
二维水动力模型
评价方法
无人机影像数据
网格
卫星影像数据