基于概率表征学习的视觉文本多模态动物姿态估计方法

正文

推荐专利

申请号：CN202411871792

申请日期：2024-12-18

公开号：CN119723668B

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及一种基于概率表征学习的视觉文本多模态动物姿态估计方法，所述的方法包括，获取图像数据集并提取图像特征；构建属性描述集，并对所述的文本关键点类别名进行转换并获取提示模板；基于所述的提示模板构建每一关键点的多变量高斯分布；基于所述的多变量高斯分布和图像特征构建关键点空间位置得分分布图；基于所述的关键点空间位置得分分布图和图像特征得到关键点热力图，基于所述的关键点热力图进行动物姿态估计，获取关键点坐标。与现有技术相比，本发明解决了现有技术中因单一提示模板和多种类动物数据分布不均造成的姿态估计不准确的问题。

技术关键词

关键点姿态估计方法热力图多模态表达式文本图像动物变量视觉矩阵模板交叉注意力机制坐标参数信号调制数据分布

系统为您推荐了相关专利信息

基于多模态域相关提示的无监督域适应方法及装置

视觉特征文本编码器多模态标记层级

一种应用于能源网络的能源路由器控制方法

能源路由器能源网络虚拟同步电机权重分配策略多模态协同

一种基于视觉大模型图像分析与规范知识库耦合的BIM模型自动化审查方法及系统

合规性生成优化建议图像分析关键词模型训练模块

一种基于SlowFast-图傅里叶变换的无人机对抗动作分类方法

动作分类方法路径特征 Softmax分类器无人机高时间分辨率

基于仿生视觉和触觉融合的自动驾驶制动测试方法和装置

触觉特征视觉特征触觉信息障碍物测试方法

基于概率表征学习的视觉文本多模态动物姿态估计方法

站点导航

APP 下载