基于单目视觉交互场景数据合成与关键点可见性更新算法

正文

推荐专利

申请号：CN202510736579

申请日期：2025-06-04

公开号：CN120726667A

公开日期：2025-09-30

类型：发明专利

摘要

本发明涉及多人姿态估计技术领域，尤其是基于单目视觉交互场景数据合成与关键点可见性更新算法，包括以下步骤：步骤1：整理好单目摄像视觉下单人图片数据，运用GroundingDINO视觉语言开放式目标检测模型处理输入的单目摄像视觉下单人图片，以‘Person’作为检索关键词以识别图片中的人物个体。本发明通过上述步骤的精细化处理，特别是目标匹配、目标位置调整和关键点可见性更新方法的引入，极大地提升了合成图像的质量，精确匹配和自然的目标粘贴不仅优化了目标与背景的融合度，还增强了合成图像的空间一致性和视觉自然度，这一改进有效避免了过拟合问题，增强了训练数据的多样性，从而提升了模型的泛化能力。

技术关键词

关键点视觉更新方法图片图像多人姿态估计掩膜单人场景算法节点数据遮挡关系关键词位置更新信息更新标记标签

系统为您推荐了相关专利信息

一种自动装置巡航路径设置的方法、系统、介质和设备

自动装置图片预置位模型训练模块数据

基于多模态交互的高等数学问题智能数据集构建方法、系统、设备及存储介质

数据集构建方法多模态交互数学输入命令知识点

端到端鼠标控制中鼠标光标位置的智能校准方法

智能校准方法光标屏幕坐标分辨率

一种基于ISAR-可见光双分支融合神经辐射场的空间目标三维重建方法、系统

分支可见光图像三维重建方法网络结构坐标

基于局部和全局注意力自适应选择的红外无人机检测方法

注意力无人机检测方法特征融合网络矩阵图像

基于单目视觉交互场景数据合成与关键点可见性更新算法

站点导航

APP 下载