一种基于多模态大语言模型的针道检测方法及装置

AITNT
正文
推荐专利
一种基于多模态大语言模型的针道检测方法及装置
申请号:CN202510486698
申请日期:2025-04-18
公开号:CN120374954A
公开日期:2025-07-25
类型:发明专利
摘要
本发明公开了一种基于多模态大语言模型(MLLM)的针道检测方法及装置,包括:构建用于训练的旋转感知目标检测数据集及多模态大语言模型的指令微调数据集;运用旋转感知针尖针柄检测算法,对CT影像的二维切片进行分析,提取针尖与针柄的空间信息;借助MLLM对初始检测结果对比核验,利用文本提示功能引导模型对置信度较低目标进行全局图像上下文分析,剔除假阳性目标;利用MLLM对切片序列进行浏览分析,结合跨切片序列的空间一致性推理,实现针尖与针柄的精确匹配。相较于现有技术,本发明方案有效缓解了现有针道自动拾取方法在针道灰度分布模糊、粘连等复杂情形下失效的难题,可提升针道检测的可靠性与准确性。
技术关键词
大语言模型 多模态 旋转框 图像特征编码 指令 CT切片 数据 拾取方法 序列 文本 模块 语义 网络 方位角 列表 鲁棒性 模板 坐标
系统为您推荐了相关专利信息
1
一种非接触式多模态热像仪测温方法
测温方法 热像仪 非接触式 多模态 可见光图像
2
文档处理方法、装置、设备及存储介质
交互内容 计算机程序产品 客户端 切片 编辑
3
一种多模态大模型驱动的电动汽车充电行为预测的方法
动态场景感知 注意力机制 多模态特征融合 负荷预测误差 时间序列模型
4
基于FPGA的电视红外复合图像目标跟踪方法及系统
多模特征 多模态特征融合 跟踪方法 图像 电视摄像机
5
自动寻位的点触控制方法、装置、电子设备及存储介质
坐标系 焊点 矩阵 元器件 电子设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号