一种基于多模态大模型的动作检测方法及设备

AITNT
正文
推荐专利
一种基于多模态大模型的动作检测方法及设备
申请号:CN202411845034
申请日期:2024-12-13
公开号:CN119964230A
公开日期:2025-05-09
类型:发明专利
摘要
本申请涉及人工智能技术领域,尤其涉及一种基于多模态大模型的动作检测方法及设备。获取记录执勤人员巡检过程的巡检视频,先基于时序动作检测模型对巡检视频进行预检,确定每个预测时间范围对应的视频段中存在的目标动作的第一概率值,再针对每个预测时间范围,若该预测时间范围对应的第一概率值不满足预设阈值要求,则基于多模态大模型对该预测时间范围对应的视频段进行检测,得到用于描述对应的视频段中存在的目标动作的检测结果,有效解决了传统的人工质检的准确率低、效率不高的问题,同时利用多模态大模型二次判断的方式提高了动作检测的准确率。
技术关键词
动作检测模型 动作检测方法 多模态 时序 视频段 矩阵 人工智能技术 数据 电子设备 指令 处理器 存储器
系统为您推荐了相关专利信息
1
一种远场麦克风捕声优化方法及相关设备
音频 去噪模型 近场麦克风阵列 编码模块 数据
2
一种基于标签分布学习的骨龄评估模型的构建方法及应用
标签 骨龄评估方法 训练样本集 概率密度函数 机器可读存储介质
3
一种航空发动机型号衍生知识迁移方法
知识迁移方法 航空发动机设计 数字孪生模型 矩阵 多头注意力机制
4
一种基于位姿耦合的无人拖拉机农具机组控制方法及系统
无人拖拉机 农具 机组控制方法 中央控制台 机组运行数据
5
基于多模态输入的AI对话系统
意图 编码向量 文本 对话系统 编码特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号