基于语言引导网络的密集人群计数方法

AITNT
正文
推荐专利
基于语言引导网络的密集人群计数方法
申请号:CN202411374172
申请日期:2024-09-29
公开号:CN119339323A
公开日期:2025-01-21
类型:发明专利
摘要
本发明涉及一种基于语言引导网络的密集人群计数方法,包括以下步骤:步骤S1:针对人群标签的点阵图进行转换,制作用于凸显前景与背景区域的真值密度图标签;步骤S2:迁移CLIP视觉语言模型至计数任务之中,并为其构建用于增强样本边界清晰程度的损失函数;步骤S3:通过多层次数量提示算法,在不损失计数精度的状况下节省模型训练开销,实现细粒度的计数;步骤S4:将预测密度图进行映射,获取该图片的预测人数。该方法有利于更高效、准确地区分图像的前景与背景,从而准确获取人群的具体人数。
技术关键词
计数方法 图像编码器 样本 文本编码器 密度 图像块 掩膜 网络 多层次 参数 标签 语义 像素点 视觉特征 定义 图片 解码器
系统为您推荐了相关专利信息
1
一种无创产前筛查的分析方法及系统
拷贝数 贝叶斯分类器 无创产前筛查 检索算法 种子
2
一种机械故障诊断方法、系统、设备和存储介质
故障诊断模型 设备知识库 实时数据 输出提示词 机械故障诊断方法
3
一种基于CBR的山区铁路隧道绿色施工决策方法
山区铁路 决策方法 案例库 孪生神经网络 指标
4
一种温度数据插值模型的构建方法、系统、装置及应用
插值模型 依赖特征 数据 序列 传感器节点
5
一种面向汇编代码的恶意软件智能分类检测方法和系统
分类检测方法 注意力 序列 数据 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号