摘要
本申请公开了一种血管介入手术目标定位方法、装置、介质及设备,该方法包括:获取初始定位模型,初始定位模型包括文本编码器、图像编码器、初始场景理解层、初始器械分割层和初始病变分割层;基于图像编码器提取样本手术图像的图像特征向量;基于图像特征向量对初始场景理解层和初始病变分割层进行训练;基于文本编码器对场景理解层输出的结果进行编码,得到文本特征向量;场景理解层为训练结束的初始场景理解层;基于图像特征向量和文本特征向量对初始器械分割层进行训练,得到定位模型;初始场景理解层用于预测样本手术图像的手术状态。本申请提供的方法和装置,可以获取准确的病变区域和器械位置,为介入手术提供更为精确和高效的辅助支持。
技术关键词
图像特征向量
文本特征向量
血管介入手术
文本编码器
图像编码器
注意力机制
定位方法
场景
手术器械
非暂态计算机可读存储介质
多层感知机
样本
编码模块
跨模态
多模态
适配器
系统为您推荐了相关专利信息
实体关系模型
风险评估模型
数据管理方法
工程项目数据
工程监理
文本特征向量
注意力参数
预训练语言模型
非暂态计算机可读存储介质
矩阵
生成方法
数据编码器
文本段落
语义特征提取
文本特征向量