摘要
本申请提供了一种音频的违规识别方法、装置、存储介质及电子终端,可获取待识别音频和待识别音频对应的音频内容文本,并将音频内容文本输入到文本违规识别模型中,得到文本识别结果。若文本识别结果反映音频内容文本存在违规词,则获取待识别音频的音量信息,并根据音量信息得到待识别音频的违规识别结果。如此,可利用文本违规识别模型和音频内容文本进行粗分类,并在确定文本违规的情况下,结合待识别音频的音量信息进行深入分析,以最终确定待识别音频是否违规。本申请通过结合音频和文本两种模态的数据,对音频进行多模态违规识别,从而可有效降低音频违规识别过程中的误识别率,进而可提高音频违规识别的准确性。
技术关键词
音频
违规识别方法
文本识别
计算机可读指令
电子终端
处理器
识别装置
识别模块
多模态
存储器
数值
数据
系统为您推荐了相关专利信息
轨迹优化方法
定位点数量
历史轨迹数据
异常点
计算机可读指令
音频特征
生成系统
动态优化方法
多模态
动态时间规整算法