摘要
本申请涉及一种视频数据的分析方法、装置和计算机设备。应用于内窥镜所采集的视频数据,所述方法包括:获取原始视频数据;将原始视频数据切分为预设长度的视频段;确定各个视频段的特征一致性损失、重构损失和动态匹配损失;基于各个视频段的特征一致性损失、重构损失和动态匹配损失,得到各个视频段的整体损失;基于整体损失,对初始Timesformer模型进行预训练,得到预训练后的Timesformer模型;获取待分析的内窥镜视频数据;基于待分析的内窥镜视频数据对预训练后的Timesformer模型进行调整,得到完备的Timesformer模型;利用完备的Timesformer模型对待分析的内窥镜视频数据进行分析,得到分析结果。采用本方法能够解决现有的视频数据的分析方法,需要大量的标记数据而存在成本高的问题。
技术关键词
内窥镜
分析方法
视频段
图像
重构
动态
计算机设备
模型训练模块
频率
数据获取模块
分析装置
分析模块
存储器
处理器
周期性
标记
系统为您推荐了相关专利信息
文本
多模态交互
翻译方法
语音信号特征
音频特征
质检管理系统
人工智能图像识别
合成纤维面料
天然纤维面料
量子点
语义分割模型
归因
协方差矩阵
注意力机制
像素点