基于神经正切核的视频场景理解方法、装置、设备及介质

正文

推荐专利

申请号：CN202511064820

申请日期：2025-07-29

公开号：CN120953878A

公开日期：2025-11-14

类型：发明专利

摘要

本发明涉及人工智能技术领域，提供一种基于神经正切核的视频场景理解方法、装置、设备及介质，应用于金融、医疗健康养老等业务场景中，能够对目标视频进行标准化处理，以减少数据差异造成的不利影响；对待处理视频进行特征提取，以捕捉多模态特征；根据多模态特征计算神经正切核矩阵，根据神经正切核矩阵及配置阈值进行谱剪枝，根据剩余参数进行低秩重构，并根据低秩因子矩阵对多模态特征进行特征融合，能够动态优化融合权重矩阵，在压缩参数量的同时维持时空特征的表达能力，从而降低模型的内存开销和计算复杂度；利用融合特征执行与视频场景理解指令对应的视频场景理解任务，并生成视频场景理解报告，结合神经正切核实现了高效的视频场景理解。

技术关键词

视频场景理解多模态特征融合特征矩阵特征值因子偏置特征二维卷积神经网络三维卷积神经网络变换特征计算机设备参数动作识别模型指令时序特征报告重构可读存储介质人工智能技术

系统为您推荐了相关专利信息

一种基于神经拟态的异构多核分布式类脑仿生架构及其工作方法

处理器信息处理单元矩阵异构耦合单元

一种基于反射式感应器的标签边界自动识别系统

自动识别系统感应器标签纸伺服电机校正模块

应用于目标检测的YOLO模型的优化处理方法及装置

YOLO模型注意力通道过滤器网络

元学习框架下基于深度多尺度融合的菊花图像智能筛选方法

智能筛选方法深度特征提取多尺度融合特征分析模块

基于多角度感知和混合尺度Transformer特征聚合的煤矸石检测方法

多角度摄像装置实时视频图像煤矿输送带图像去噪算法融合特征

基于神经正切核的视频场景理解方法、装置、设备及介质

站点导航

APP 下载