摘要
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能实现视频画面自动场景分类的系统,包括数据接收模块、视频预处理单元、音频预处理模块、加密传输模块、特征提取单元、动态加权模块、特征融合模块、场景分类模块、场景语义解析模块、结果输出模块和反馈模块;视频预处理单元与数据接收模块连接,音频预处理单元与视频预处理单元连接,场景分类模块基于多模态大模型对接收到的图像画面特征向量的场景理解,根据理解自动进行大量画面分类,确定视频所属的场景类别,以此方式解决了现有技术中的基于人工智能的视频画面自动场景分类系统存在特征融合效果不佳、场景语义解析深度不足的技术问题,实现提质提效。
技术关键词
场景分类
特征提取单元
数据接收模块
视频
画面
输出模块
音频特征提取
视觉特征提取
特征提取模块
深度学习模型优化
人机交互模块
亮度补偿模型
场景类别
语义
特征匹配算法
动态
深度神经网络