基于深度学习的姿态估计方法以及系统

正文

推荐专利

基于深度学习的姿态估计方法以及系统

申请号：CN202411457850

申请日期：2024-10-18

公开号：CN119006598B

公开日期：2025-04-29

类型：发明专利

摘要

本发明提供一种基于深度学习的姿态估计方法以及系统，应用于图像识别领域，其中，方法包括：获取目标图像、自然语言指令以及模板图像；通过预设的提示生成器，分别对自然语言指令与模板图像进行编码，得到文本特征与视觉特征；通过提示生成器的大语言模型，对文本特征与视觉特征进行多模态特征融合，得到多模态特征信息；通过提示生成器的视觉嵌入投影层，基于多模态特征信息，生成姿态提示向量；将目标图像与姿态提示向量输入至预设的姿态估计器，得到姿态估计器输出的关键点热力图；对关键点热力图进行关键点位置解析，得到目标图像的姿态估计结果。通过本发明能够灵活地适应不同的类别的姿态估计需求。

技术关键词

自然语言姿态估计方法图像特征编码样本图像类别关键点热力图指令模板多模态特征融合视觉特征非暂态计算机可读存储介质姿态估计系统数据文本处理器

系统为您推荐了相关专利信息

一种基于大语言模型增强的低资源事件抽取方法

大语言模型事件抽取方法样本多级特征文本

一种基于语音识别的机器人控制方法及系统

机器人控制方法构建语音识别模型声道多特征信息融合特征值

提示词的生成方法及装置、程序产品、存储介质

样本网络超参数生成方法注意力机制

一种基于卷积神经网络的医疗辅助诊断方法及系统

医疗辅助诊断方法卷积神经网络模型医学影像数据电子病历正则化方法

高压断路器机械故障的诊断模型训练方法和诊断方法

故障诊断模型高压断路器极限学习机萤火虫算法断路器分合闸线圈

基于深度学习的姿态估计方法以及系统

站点导航

APP 下载