摘要
本发明涉及数据处理技术领域,公开了一种基于机器学习实现多模态数据审核的处理方法,包括:识别待审核样本的内容,确定样本格式并确定数据处理方式,提取待审核样本中不同格式特征构建特征数据组;根据特征数据组确定待审核样本的风险系数;获取待审核样本中音频或视频的所在位置,根据所在位置确定匹配范围,获取匹配范围内文本与音频或视频的内容匹配度,根据内容匹配度判断是否对风险系数进行调整;将最终风险系数与系数阈值进行比对,根据比对结果确定待审核样本处理等级。本申请实现了对文本、音频和视频等多种格式数据的统一审核处理,提升了跨模态违规识别的精准度。
技术关键词
文本
样本
数据处理方式
多模态
音频特征
格式
关键词
音色特征
梅尔频率倒谱系数
识别特征
自然语言
视频帧间
图像处理
关键帧
数据处理技术
场景
词语
系统为您推荐了相关专利信息
存储器测试方法
深度生成模型
测试意图
多模态响应
测试存储器
客户端
卷积神经网络模型
联邦学习模型
参数
版权保护方法
深度学习模型训练
数据
图像
训练集
训练测试方法