摘要
本发明公开了一种基于多模态大语言模型(MLLM)的针道检测方法及装置,包括:构建用于训练的旋转感知目标检测数据集及多模态大语言模型的指令微调数据集;运用旋转感知针尖针柄检测算法,对CT影像的二维切片进行分析,提取针尖与针柄的空间信息;借助MLLM对初始检测结果对比核验,利用文本提示功能引导模型对置信度较低目标进行全局图像上下文分析,剔除假阳性目标;利用MLLM对切片序列进行浏览分析,结合跨切片序列的空间一致性推理,实现针尖与针柄的精确匹配。相较于现有技术,本发明方案有效缓解了现有针道自动拾取方法在针道灰度分布模糊、粘连等复杂情形下失效的难题,可提升针道检测的可靠性与准确性。
技术关键词
大语言模型
多模态
旋转框
图像特征编码
指令
CT切片
数据
拾取方法
序列
文本
模块
语义
网络
方位角
列表
鲁棒性
模板
坐标
系统为您推荐了相关专利信息
动态场景感知
注意力机制
多模态特征融合
负荷预测误差
时间序列模型
多模特征
多模态特征融合
跟踪方法
图像
电视摄像机