基于手术场景的图像理解推理系统及方法

AITNT
正文
推荐专利
基于手术场景的图像理解推理系统及方法
申请号:CN202510147756
申请日期:2025-02-11
公开号:CN120071355B
公开日期:2025-11-07
类型:发明专利
摘要
本发明涉及手术场景的医学图像加工技术领域,具体涉及基于手术场景的图像理解推理系统及方法。其系统包括图像编码器、感知解码器、多模态大语言模型;所述图像编码器用于接收手术图像,将手术图像编码为图像特征;所述感知解码器用于将图像特征和可学习的对象查询编码为视觉符号发送至多模态大语言模型,对多模态大语言模型输出的信息进行解码;所述多模态大语言模型用于接收手术文本指令及感知解码器的视觉符号,结合手术文本指令及视觉符号进行理解推理,输出手术文本响应及手术分割掩码响应。通过其精简的架构和指令微调方法,有效地弥合了自然图像和手术图像之间的领域差距,实现了精确的像素级推理。
技术关键词
手术场景 大语言模型 符号 视觉 图像编码器 推理系统 推理方法 解码器 多模态 文本 对象 像素 Softmax函数 交叉注意力机制 手术器械 指令 密集特征
系统为您推荐了相关专利信息
1
一种多腔室分区封装的高速VCSEL半导体X芯片装置及封装方法
芯片装置 多腔室 倒装结构 拾取结构 上料结构
2
一种大语言模型辅助生成车辆三维模型的方法及系统
车辆结构 大语言模型 三维模型信息 车辆三维模型 文本
3
基于检索增强的大语言模型问答方法、装置、设备及介质
大语言模型 问答方法 答案 向量匹配方法 检索策略
4
视频生成方法、装置及电子设备
图像 视频生成方法 指令 模板 标签
5
一种智能自适应标定方法及系统
静态特征 标定方法 投影模型 掩膜 运动补偿模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号