基于概率表征学习的视觉文本多模态动物姿态估计方法

AITNT
正文
推荐专利
基于概率表征学习的视觉文本多模态动物姿态估计方法
申请号:CN202411871792
申请日期:2024-12-18
公开号:CN119723668B
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及一种基于概率表征学习的视觉文本多模态动物姿态估计方法,所述的方法包括,获取图像数据集并提取图像特征;构建属性描述集,并对所述的文本关键点类别名进行转换并获取提示模板;基于所述的提示模板构建每一关键点的多变量高斯分布;基于所述的多变量高斯分布和图像特征构建关键点空间位置得分分布图;基于所述的关键点空间位置得分分布图和图像特征得到关键点热力图,基于所述的关键点热力图进行动物姿态估计,获取关键点坐标。与现有技术相比,本发明解决了现有技术中因单一提示模板和多种类动物数据分布不均造成的姿态估计不准确的问题。
技术关键词
关键点 姿态估计方法 热力图 多模态 表达式 文本 图像 动物 变量 视觉 矩阵 模板 交叉注意力机制 坐标 参数 信号调制 数据分布
系统为您推荐了相关专利信息
1
基于多模态域相关提示的无监督域适应方法及装置
视觉特征 文本编码器 多模态 标记 层级
2
一种应用于能源网络的能源路由器控制方法
能源路由器 能源网络 虚拟同步电机 权重分配策略 多模态协同
3
一种基于视觉大模型图像分析与规范知识库耦合的BIM模型自动化审查方法及系统
合规性 生成优化建议 图像分析 关键词 模型训练模块
4
一种基于SlowFast-图傅里叶变换的无人机对抗动作分类方法
动作分类方法 路径特征 Softmax分类器 无人机 高时间分辨率
5
基于仿生视觉和触觉融合的自动驾驶制动测试方法和装置
触觉特征 视觉特征 触觉信息 障碍物 测试方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号