一种基于人体肢体技能操作视频的内容标注方法、装置、计算机设备及可读存储介质

正文

推荐专利

申请号：CN202410785783

申请日期：2024-06-18

公开号：CN118781516B

公开日期：2025-05-06

类型：发明专利

摘要

本发明公开了一种基于人体肢体技能操作视频的内容标注方法、装置、计算机设备及可读存储介质，包括：首先获取并预处理多路视频流媒体数据，提取视频关键帧、视觉及声学特征。随后，通过匹配识别操作生成视频和音频评价结果数据，并据此确定操作要点和操作单元的视频片段定位。利用预训练的内容标签库进行标签标注，生成待定标签标注结果。待审核通过后，该结果将作为最终的目标标注结果。如此设计，提高了标注精度和效率，为人体肢体技能操作的准确评估提供了有力支持。

技术关键词

声学特征内容标注方法视觉特征音频视频特征数据标签视频流计算机设备关键帧内容文本人体媒体自动语音识别技术偏移特征 MFCC算法

系统为您推荐了相关专利信息

模型训练方法、装置、报告生成装置以及计算机设备

视觉特征融合特征样本文本对象

音频处理方法、系统及设备

音频扬声器数据演奏乐器打击乐器

推荐方法及电子设备

健康监测设备内容推荐方法显示信息场景电子设备

多信息载体视角下用于密封电子元器件多余物检测的集成模型构建及检测方法

密封电子元器件多余物模型构建方法分类器信息载体声谱

停车环境分析方法、系统、计算机设备和存储介质

环境分析方法视觉特征多模态计算机设备动作识别模型

一种基于人体肢体技能操作视频的内容标注方法、装置、计算机设备及可读存储介质

站点导航

APP 下载