摘要
本发明公开了基于深度学习的多模态数据标注系统及方法,涉及数据标注技术领域,基于深度学习的多模态数据标注方法具体步骤包括:步骤一、输入原始视频数据流,对原始视频数据进行模态分解与预处理,得到多模态数据,步骤二、分类分析收集到的多模态数据,通过提取多模态数据特征,设置多模态对应的特征系数,步骤三、基于多模态对应的特征系数设置联合特征向量,根据联合特征向量实现实时标注质量监控,本发明通过通过提取多模态数据特征自定义图像数据特征、文本数据特征与音频数据特征系数,通过参考不同特征系数设置联合特征向量,根据联合特征向量实现实时标注质量监控。
技术关键词
数据标注方法
视频帧
文本
音频特征
数据标注系统
短时傅里叶变换
卷积神经网络提取
像素
数据标注技术
特征自定义
图像多模态
滑动窗口算法
语音识别模型
生成时间戳
边缘检测算法
系统为您推荐了相关专利信息
耳鼻喉患者
文本特征向量
多模态
生理
梯度提升决策树
媒体
资源标识符
机器学习模型
生成提示信息
信息处理方法
多头注意力机制
情感分析方法
情感分析模型
模态特征
融合特征
自动建模方法
数字孪生
图纸
多模态
局部纹理特征