摘要
本发明公开了一种基于视觉语言引导的肿瘤与靶区同步分割方法及系统,包括:构建融合医学影像与临床文本的多模态数据集;采用统一编码器提取共享视觉特征,双分支解码器分别预测肿瘤区(GTV)与临床靶区(CTV),实现信息共享与任务差异化建模;引入医学预训练大语言模型,分别提取与GTV和CTV相关的语言特征;设计视觉语言协同注意力模块,进行视觉语言动态融合对齐,引导并强化任务相关语义并抑制冗余信息;融合多模态特征后输出GTV与CTV的精准同步分割结果。相较于现有方案,本发明有效解决了医学影像中肿瘤靶区边界模糊、多模态信息利用不足的难题,显著提升了分割精度与鲁棒性,为临床放疗规划提供可靠支持。
技术关键词
协同注意力
嵌入特征
视觉特征
融合特征
大语言模型
多模态数据管理
分割方法
影像
肿瘤
融合多模态特征
文本
放射科
特征提取模块
多任务损失函数
解码器
对齐模块
医学
多模态特征融合
语义特征
系统为您推荐了相关专利信息
条形码识别方法
字符
循环神经网络模型
列表
卷积神经网络模型