摘要
本申请实施例提供了一种音视频情绪标记方法、装置、电子设备、存储介质及产品,涉及音视频情绪标记技术领域。获取待标记音视频的音频流数据,对音频流数据进行分帧处理,得到多个音频帧,将各音频帧按时间逐个输入情绪识别模型,得到各音频帧对应的情绪结果,对情绪结果匹配的相邻音频帧进行合并,得到对应的目标音频段,根据目标音频段对待标记音视频进行分段,并将对应的情绪结果标记于对应的音视频段中。本申请实施例通过情绪识别模型的音频分析识别出不同音频帧对应的情绪结果,从而确定音视频段并标记出对应的情绪结果,使得情绪标记更加准确,方便用户快速定位情绪对应的音视频段。
技术关键词
音视频
音频
情绪识别模型
标记方法
特征工程
定位情绪
分段
电子设备
标记技术
谐波失真
数据获取模块
标记装置
频率
时序特征
处理器
样式
识别模块