摘要
本发明属于人工智能技术领域,公开了基于大语言模型和自适应对比解码的人类动作理解方法,提出了一种FLARE框架,通过引入预训练的冻结大型语言模型LLM和冻结的动作编码器,使动作和语言语义对齐,并利用自适应对比解码AdaCD方法,减少对语言先验的过度依赖,从而提升模型对动作的理解能力,使该方法能够处理多种动作理解任务,提高了人类动作理解方法的泛化能力,同时降低了现有技术中存在的任务特定性和计算资源消耗问题。
技术关键词
大语言模型
大规模文本数据
人类
生成动作
多任务
编码器组合
线性
对齐方法
人工智能技术
框架
样本
集成模块
解码方法
序列
格式
语义
系统为您推荐了相关专利信息
请求调度方法
服务器特征
多任务学习模型
时延
表达式
火灾检测系统
协作模型
机载视觉
小型无人机
多任务
肿瘤消融系统
图像处理子系统
机器人基坐标系
标记
网络架构
面向知识图谱
SPARQL查询
答案
预训练语言模型
深度优先搜索