摘要
本发明涉及一种基于概率表征学习的视觉文本多模态动物姿态估计方法,所述的方法包括,获取图像数据集并提取图像特征;构建属性描述集,并对所述的文本关键点类别名进行转换并获取提示模板;基于所述的提示模板构建每一关键点的多变量高斯分布;基于所述的多变量高斯分布和图像特征构建关键点空间位置得分分布图;基于所述的关键点空间位置得分分布图和图像特征得到关键点热力图,基于所述的关键点热力图进行动物姿态估计,获取关键点坐标。与现有技术相比,本发明解决了现有技术中因单一提示模板和多种类动物数据分布不均造成的姿态估计不准确的问题。
技术关键词
关键点
姿态估计方法
热力图
多模态
表达式
文本
图像
动物
变量
视觉
矩阵
模板
交叉注意力机制
坐标
参数
信号调制
数据分布
系统为您推荐了相关专利信息
能源路由器
能源网络
虚拟同步电机
权重分配策略
多模态协同
合规性
生成优化建议
图像分析
关键词
模型训练模块
动作分类方法
路径特征
Softmax分类器
无人机
高时间分辨率