摘要
本发明公开了一种内窥镜报告生成方法、装置、设备及可读存储介质,应用于计算机视觉与深度学习技术领域,包括:获取内窥镜实时视频流,基于内窥镜实时视频流的时序特征、空间特征和运动特征确定目标检查类型;确定内窥镜实时视频流的全局特征和局部特征,并将全局特征和局部特征进行拼接,基于拼接得到的拼接特征确定目标检查部位;对内窥镜实时视频流进行病变实时检测,得到病变区域;基于目标检查类型、目标检查部位、病变区域进行检查报告生成,得到目标内窥镜报告。由于无需医生人工确定各个指标生成报告,故可以提高内窥镜报告生成的效率,且由于会对基于全局特征和局部特征确定目标检查部位,使得可以准确性的确定多个检查部位。
技术关键词
内窥镜
实时视频流
报告生成方法
时序特征
报告生成装置
运动特征
关键帧
完整性监控
多尺度特征融合
融合特征
深度学习技术
可读存储介质
多模态
存储计算机程序
大语言模型
生成报告
参数
计算机视觉