基于语言引导网络的密集人群计数方法

正文

推荐专利

基于语言引导网络的密集人群计数方法

申请号：CN202411374172

申请日期：2024-09-29

公开号：CN119339323A

公开日期：2025-01-21

类型：发明专利

摘要

本发明涉及一种基于语言引导网络的密集人群计数方法，包括以下步骤：步骤S1：针对人群标签的点阵图进行转换，制作用于凸显前景与背景区域的真值密度图标签；步骤S2：迁移CLIP视觉语言模型至计数任务之中，并为其构建用于增强样本边界清晰程度的损失函数；步骤S3：通过多层次数量提示算法，在不损失计数精度的状况下节省模型训练开销，实现细粒度的计数；步骤S4：将预测密度图进行映射，获取该图片的预测人数。该方法有利于更高效、准确地区分图像的前景与背景，从而准确获取人群的具体人数。

技术关键词

计数方法图像编码器样本文本编码器密度图像块掩膜网络多层次参数标签语义像素点视觉特征定义图片解码器

系统为您推荐了相关专利信息

一种无创产前筛查的分析方法及系统

拷贝数贝叶斯分类器无创产前筛查检索算法种子

一种机械故障诊断方法、系统、设备和存储介质

故障诊断模型设备知识库实时数据输出提示词机械故障诊断方法

一种基于CBR的山区铁路隧道绿色施工决策方法

山区铁路决策方法案例库孪生神经网络指标

一种温度数据插值模型的构建方法、系统、装置及应用

插值模型依赖特征数据序列传感器节点

一种面向汇编代码的恶意软件智能分类检测方法和系统

分类检测方法注意力序列数据标签

基于语言引导网络的密集人群计数方法

站点导航

APP 下载