直播视频的重点标记方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411070781

申请日期：2024-08-06

公开号：CN119071520A

公开日期：2024-12-03

类型：发明专利

摘要

本发明提供的直播视频的重点标记方法、装置、设备及存储介质，通过获取直播视频的音频数据、视频数据和互动数据；对所述音频数据、所述视频数据和所述互动数据进行特征提取，得到音频数据特征、视频数据特征和互动数据特征；将所述音频数据特征、所述视频数据特征和所述互动数据特征进行特征融合，得到多模态融合特征；将所述多模态融合特征输入至事件检测模型中，得到重点事件信息；对所述重点事件信息进行重要性筛选，得到目标重点事件。本发明通过综合分析音频数据、视频数据和互动数据，多模态融合特征的使用能够更加全面地捕捉直播过程中不同维度的关键信息。这样可以更精准地识别出直播中的重点事件，提升事件检测的准确性和可靠性。

技术关键词

视频数据特征标记方法音频融合特征事件检测模型多模态非暂态计算机可读存储介质面部表情特征关键词特征特征提取模块情感特征场景特征数据获取模块麦克风标记装置处理器语音特征终端

系统为您推荐了相关专利信息

一种密集目标检测方法及系统

GRU模型语义特征门控循环单元序列宏块

长视频定位方法、系统、设备及存储介质

视频定位方法文本视频帧状态空间模型视频定位系统

一种基于AI大模型的音响交互意图识别与智能决策方法

智能决策方法意图识别意图指令文本特征向量音响

一种基于DSP和FPGA的图像处理数字板卡

FPGA芯片网络传输单元矩形连接器网络变压器模块 MOSFET驱动电路

基于神经网络的音频编解码方法、装置、设备及存储介质

音频编解码方法编解码器计算机可读指令矢量量化器网络

直播视频的重点标记方法、装置、设备及存储介质

站点导航

APP 下载