摘要
本发明涉及多人姿态估计技术领域,尤其是基于单目视觉交互场景数据合成与关键点可见性更新算法,包括以下步骤:步骤1:整理好单目摄像视觉下单人图片数据,运用GroundingDINO视觉语言开放式目标检测模型处理输入的单目摄像视觉下单人图片,以‘Person’作为检索关键词以识别图片中的人物个体。本发明通过上述步骤的精细化处理,特别是目标匹配、目标位置调整和关键点可见性更新方法的引入,极大地提升了合成图像的质量,精确匹配和自然的目标粘贴不仅优化了目标与背景的融合度,还增强了合成图像的空间一致性和视觉自然度,这一改进有效避免了过拟合问题,增强了训练数据的多样性,从而提升了模型的泛化能力。
技术关键词
关键点
视觉
更新方法
图片
图像
多人姿态估计
掩膜
单人
场景
算法
节点
数据
遮挡关系
关键词
位置更新
信息更新
标记
标签
系统为您推荐了相关专利信息
数据集构建方法
多模态交互
数学
输入命令
知识点