摘要
本发明属于智慧医疗技术领域、计算机视觉领域,特别涉及一种面向开放式外科手术的最佳镜头智能预测方法及系统,方法包括在开放式外科手术场景中设置至少6个角度的摄像头,通过深度卷积神经网络从视频帧中提取视频特征、通过目标检测网络从视频帧中提取语义特征;将提取的视频特征和语义特征拼接在一起作为联合特征向量;将联合特征向量输入到多个Time‑Block模块堆叠的网络提取得到时间特征向量;将归一化处理的时间特征向量通过softmax层得到每个摄像头标签概率分布,并将概率最高的摄像头作为最佳视角进行推送。本发明可以实现高速、无缝切换视角的能力,从而确保手术过程中的关键信息得以完整、清晰地记录和分析。
技术关键词
开放式外科手术
智能预测方法
深度卷积神经网络
多头注意力机制
语义特征
特征提取网络
上下文特征
镜头
标签
视频图像特征
智能预测系统
卷积特征
拼接模块
智慧医疗技术
多尺度
系统为您推荐了相关专利信息
语义特征
信息检索
评估设备
计算机程序产品
评估装置
语义向量
综合语义
文本
语义特征提取
电子设备本体
多模态深度学习
监控视频图像
学习方法
训练图像数据
文本编码器
对齐模块
变化检测方法
双粒度
空间金字塔池化
像素点
镜片缺陷检测方法
图像
多尺度特征融合
感知特征
区域分割方法