基于多模态大模型实现行人属性识别及评估的方法、装置、处理器及其计算机可读存储介质

AITNT
正文
推荐专利
基于多模态大模型实现行人属性识别及评估的方法、装置、处理器及其计算机可读存储介质
申请号:CN202510188165
申请日期:2025-02-20
公开号:CN120107894A
公开日期:2025-06-06
类型:发明专利
摘要
本发明涉及一种基于多模态大模型实现行人属性识别及评估的方法,包括以下步骤:人体识别模块识别确认输入图像中是否存在人体对象,并定位人体目标;行人属性分析模块在多模态大模型的基础上进行微调,分析图像中行人所具有的各项属性;输出质量评价模块通过预训练的行人属性图文匹配的clip模型,计算多模态大模型的输出文本与原始图像之间的余弦相似度;精度评估模块,检验模型输出文本中关于行人属性的准确性。采用了本发明的基于多模态大模型实现行人属性识别及评估的方法、装置、处理器及其计算机可读存储介质,能够准确地识别出行人属性,有效评估识别结果的质量,确保输出的可靠性和准确性,为智能安监系统的应用和发展提供强有力的技术支持。
技术关键词
行人属性识别 多模态 计算机可执行指令 文本 图像 识别模块 分析模块 人体 处理器 可读存储介质 安监系统 图文 行人检测 对象 数据 文件夹 格式 精度
系统为您推荐了相关专利信息
1
储能电站的充放电策略确定方法以及装置
储能电站 充放电策略 计算机可执行指令 充放电次数 整数线性规划
2
应用于自动化黄芪精产线的设备状态数据管理方法及系统
产线设备 设备状态数据 设备运行趋势 管理策略 设备状态管理
3
基于NLP处理的文本可读性分析方法、系统及电子设备
复杂度特征 依存句法树 分析方法 文本可读性分析 密度
4
一种基于实心圆特征点的相机标定方法及系统
相机标定方法 投影变换矩阵 实心 标定相机 坐标系
5
一种智慧城市多租户管理方法、设备及介质
多租户管理方法 政务 云平台 镜像 资源
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号