摘要
本发明涉及智能场景识别技术领域,公开了一种智能交互控制单元的智能场景识别方法及设备,该方法包括:对数字机顶盒中智能交互控制单元的操作序列、视频内容和音频数据进行采集和预处理,得到标准多模态数据集;将标准多模态数据集输入多分支深度神经网络模型,通过并行处理提取时序、视觉和音频特征,得到融合场景特征向量;对融合场景特征向量进行降维和语义映射,得到压缩语义特征向量;将压缩语义特征向量与预定义场景查询向量进行相似度计算,得到场景匹配分数;基于场景匹配分数,综合多个子分类器的输出,得到目标场景分类结果,本发明能够在资源受限的数字机顶盒上高效运行,实现实时场景识别。
技术关键词
智能交互控制
智能场景识别方法
融合场景
数字机顶盒
多模态
梯度提升决策树算法
深度神经网络模型
支持向量机分类器
一维卷积神经网络
场景分类
视频内容特征
注意力机制
集成学习方法
语义
场景类别
音频特征
多尺度图像分割
编码器
系统为您推荐了相关专利信息
数据中心
趋势预测模型
救援车辆
应急管理系统
移动应急电源车
大语言模型
感知系统
科技
可视化子系统
可视化模块
计算方法
风险
多模态特征融合
多尺度特征提取
监测场景
智能管理方法
高维特征向量
文本特征向量
视频时空特征
基因