摘要
本发明涉及智能管控技术领域,公开了一种基于AI的音视频融合管控方法及装置,该方法包括:获取由音视频融合预控平台接收到的音频数据和视频数据;基于预设融合算法对音频数据和视频数据进行融合得到音视频融合数据;响应于检测到的由目标系统触发的第一触发操作,对音视频融合数据执行相应的管控操作,音视频融合预控平台通过与目标系统的通信实现对音视频融合数据的联动控制,管控操作至少包括数据识别操作。可见,实施本发明能够通过音视频融合预控平台基于预设融合算法快速、准确地对音频及视频数据融合得到音视频融合数据,且能够通过音视频融合预控平台与目标系统的联动实现对音视频数据的精准管控,有利于提高对音视频数据的处理效率。
技术关键词
视频特征数据
多模态融合技术
音频特征数据
管控方法
情感识别模型
融合算法
监控算法
对音视频
噪声抑制算法
视频特征提取
音频特征提取
平台
模型算法
可执行程序代码
场景监控
系统为您推荐了相关专利信息
视频特征数据
视频解码模块
深度学习模型
图像亮度值
特征值
情感识别模型
音频
识别模块
生成系统
显示控制模块
实时语音
大语言模型
定义标签
情感识别模型
多任务
数字孪生
管控方法
图谱
GNSS定位数据
激光雷达扫描数据