大模型驱动的时空特征与文本增强少样本动作捕捉方法

正文

推荐专利

申请号：CN202510388665

申请日期：2025-03-31

公开号：CN119903479B

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开大模型驱动的时空特征与文本增强少样本动作捕捉方法，属于动作捕捉技术领域，用于视频动作捕捉，包括获取视频数据并进行预处理，所述视频数据包括待进行动作捕捉的查询视频数据和带有动作标签的支持集视频数据，将预处理后的视频数据输入视觉编码器中，得到视频数据的视觉特征；综合两次类别概率分布，得出查询视频数据的动作捕捉结果。本发明通过时序增强适配器和时空融合适配器实现高效时空特征提取，增强了视频特征的时空建模能力；利用多层次注意力机制，提升了文本与视频特征的融合能力，构建了具有强泛化能力的类原型；在少样本学习任务中显著提升了模型的捕捉准确率，可训练参数量少，降低了计算成本。

技术关键词

动作捕捉方法视觉特征视频适配器数据原型前馈神经网络样本动作捕捉技术文本编码器时序多层感知器标签注意力机制超参数多层次上采样模块

系统为您推荐了相关专利信息

一种复合多参数传感器芯片用高精度电流检测系统

高精度电流检测多参数传感器信号隔离电路数据储存器监控传感器

一种基于分级注意力融合的多模态超声预测方法

注意力融合特征彩色多普勒影像全局信息融合

一种基于小流域水生态环境保护阶段的河流类型划分方法

流域水生态数据趋势预测模型网络结构水文

基于知识图谱增强的黑灰产治理大模型的优化方法、知识图谱数据结构及装置

三元组资金流模型训练模块关系知识图谱平台

一种基于MQTT的云边交互系统

MQTT消息交互系统云端物联网设备访问控制模块

大模型驱动的时空特征与文本增强少样本动作捕捉方法

站点导航

APP 下载