一种可伸缩思维链引导的少样本连续教学行为识别方法

正文

推荐专利

申请号：CN202510673483

申请日期：2025-05-23

公开号：CN120564264A

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了一种可伸缩思维链引导的少样本连续教学行为识别方法，涉及图像处理领域。通过思维链引导大语言模型(LLMs)来挖掘行为标签中不同层次的语义知识，并将其凝练为(主，谓，宾)结构的三元组知识，解决了现有的预训练视觉语言模型对动词的理解能力较弱的问题，实现对行为的准确理解和识别。相比于常见的少样本连续学习方法，我们的方法冻结了预训练视觉语言模型的主干网络，只通过提示学习进行模型的训练，相比于传统的主干网络表征适配调优，我们的方法训练参数很少，极大降低了计算复杂度。本发明在教室场景数据集上进行少样本连续教学行为识别任务，与其他先进方法相比，本发明取得了最优的识别结果。

技术关键词

文本编码器视觉特征识别方法大语言模型文本特征向量教室场景样本语义三元组连续学习方法教学标签网络表征层级结构组件图像编码

系统为您推荐了相关专利信息

一种基于多模态分裂注意力融合的情绪识别方法

情绪识别方法情绪识别模型特征提取模块多模态融合特征

一种基于点提示的胎盘位置自动识别方法

位置识别自动识别方法预训练模型编码器医学影像信息

项目处理方法及装置

项目意图识别文本大语言模型意图类别

网络拥塞节点识别方法及装置、介质、设备

网络拓扑模型网络节点蚂蚁算法时延节点识别方法

一种多模态情感识别方法及装置

多模态情感识别交互特征视频帧特征感知特征情感识别方法

一种可伸缩思维链引导的少样本连续教学行为识别方法

站点导航

APP 下载