一种基于深度学习的直播行为跟踪系统

正文

推荐专利

一种基于深度学习的直播行为跟踪系统

申请号：CN202510726701

申请日期：2025-06-03

公开号：CN120708001A

公开日期：2025-09-26

类型：发明专利

摘要

本发明涉及直播行为监控技术领域，尤指一种基于深度学习的直播行为跟踪系统，通过对直播视频流同步提取图像和音频数据，结合帧抽取、图像增强和语音识别，获得高质量的多源信息，提升特征分析的准确性。通过预训练卷积神经网络提取图像特征，深度学习模型提取音频特征，并融合语音转写文本，基于注意力机制动态调整各模态特征的权重，实现对复杂场景和隐蔽违规行为的精准识别，有效应对图像伪装、隐语表达风险。实时输出违规类别及置信度，一旦检测到疑似违规行为，立即触发告警、中断或遮蔽操作，并将相关证据上传至审核数据库。实现了对直播违规行为的高效、准确和全流程管控。

技术关键词

图像特征向量跟踪系统模态特征文本特征向量前馈神经网络注意力机制图像增强深度学习模型梅尔频率倒谱系数训练卷积神经网络标签音频特征执行语音识别视频流同步损失函数优化序列数据

系统为您推荐了相关专利信息

基于边缘计算与多模态数据融合的工业废水智能处理方法

仿真模型成分分析图像特征向量计算机程序代码报告

一种基于Transformer的路侧LiDAR-相机外参标定方法及系统

相机外参标定方法图像三维点云数据参数深度编码器

一种机载高可靠智能语音通话降静噪方法

高可靠智能音频掩蔽阈值语音 SPI协议

一种空间非平稳性土壤湿度的计算方法及装置

站点异质矩阵计算方法露点温度

一种基于弱纹理环境下的视觉SLAM改进方法

特征点视觉SLAM方法动态物体解码器双三次插值

一种基于深度学习的直播行为跟踪系统

站点导航

APP 下载