一种可伸缩思维链引导的少样本连续教学行为识别方法

AITNT
正文
推荐专利
一种可伸缩思维链引导的少样本连续教学行为识别方法
申请号:CN202510673483
申请日期:2025-05-23
公开号:CN120564264A
公开日期:2025-08-29
类型:发明专利
摘要
本发明公开了一种可伸缩思维链引导的少样本连续教学行为识别方法,涉及图像处理领域。通过思维链引导大语言模型(LLMs)来挖掘行为标签中不同层次的语义知识,并将其凝练为(主,谓,宾)结构的三元组知识,解决了现有的预训练视觉语言模型对动词的理解能力较弱的问题,实现对行为的准确理解和识别。相比于常见的少样本连续学习方法,我们的方法冻结了预训练视觉语言模型的主干网络,只通过提示学习进行模型的训练,相比于传统的主干网络表征适配调优,我们的方法训练参数很少,极大降低了计算复杂度。本发明在教室场景数据集上进行少样本连续教学行为识别任务,与其他先进方法相比,本发明取得了最优的识别结果。
技术关键词
文本编码器 视觉特征 识别方法 大语言模型 文本特征向量 教室场景 样本 语义 三元组 连续学习方法 教学 标签 网络表征 层级 结构组件 图像编码
系统为您推荐了相关专利信息
1
一种基于多模态分裂注意力融合的情绪识别方法
情绪识别方法 情绪识别模型 特征提取模块 多模态 融合特征
2
一种基于点提示的胎盘位置自动识别方法
位置识别 自动识别方法 预训练模型 编码器 医学影像信息
3
项目处理方法及装置
项目 意图识别 文本 大语言模型 意图类别
4
网络拥塞节点识别方法及装置、介质、设备
网络拓扑模型 网络节点 蚂蚁算法 时延 节点识别方法
5
一种多模态情感识别方法及装置
多模态情感识别 交互特征 视频帧特征 感知特征 情感识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号