一种基于视听融合的机器人室内易混淆行为类识别方法

正文

推荐专利

申请号：CN202411085491

申请日期：2024-08-08

公开号：CN119028016A

公开日期：2024-11-26

类型：发明专利

摘要

本发明公开了一种基于视听融合的机器人室内易混淆行为类识别方法，使用视频在空间分布上的信息、时间差分上的特征信息以及音频中的类别信息对视频中的行为类进行整体识别。在音频信息的处理上，直接使用膨胀因果卷积处理原始音频信息，从而避免音频转化为其它信息格式过程中的信息损失。考虑到行为特征在视觉、声音上是不均匀分布的，本发明在解码器中引入了类别自适应的特征融合网络。融合网络通过引入类别混淆表构建了损失函数形成了自适应的训练范式。本发明使用深度网络对现有行为识别视频数据滤除杂音，并构建了室内场景下针对视觉易混淆行为的视频数据集，能够训练出收敛的视听融合的行为识别模型。

技术关键词

类识别方法支路采样率视听机器人视觉特征音频采样识别视频数据残差神经网络特征融合网络切片分辨率元素图像块

系统为您推荐了相关专利信息

一种用于上肢助力的外骨骼机器人结构

双自由度旋转外骨骼机器人助力臂组件肘关节转接件

基于数字人技术的贷款审核系统

控制中心智能机器人活体检测模块音视频声纹检测模块

一种面向关隘地形的分层调度集群路径规划方法

路径规划方法节点列表集群规划机器人

一种机器人腿部结构及双足机器人

机器人腿部结构直线驱动模组交叉滚子轴承压紧法兰俯仰电机

一种智能机器人视觉图像采集装置及方法

图像采集控制智能机器人视觉图像采集装置序列实体

一种基于视听融合的机器人室内易混淆行为类识别方法

站点导航

APP 下载