基于多模态大模型实现行人属性识别及评估的方法、装置、处理器及其计算机可读存储介质

正文

推荐专利

申请号：CN202510188165

申请日期：2025-02-20

公开号：CN120107894A

公开日期：2025-06-06

类型：发明专利

摘要

本发明涉及一种基于多模态大模型实现行人属性识别及评估的方法，包括以下步骤：人体识别模块识别确认输入图像中是否存在人体对象，并定位人体目标；行人属性分析模块在多模态大模型的基础上进行微调，分析图像中行人所具有的各项属性；输出质量评价模块通过预训练的行人属性图文匹配的clip模型，计算多模态大模型的输出文本与原始图像之间的余弦相似度；精度评估模块，检验模型输出文本中关于行人属性的准确性。采用了本发明的基于多模态大模型实现行人属性识别及评估的方法、装置、处理器及其计算机可读存储介质，能够准确地识别出行人属性，有效评估识别结果的质量，确保输出的可靠性和准确性，为智能安监系统的应用和发展提供强有力的技术支持。

技术关键词

行人属性识别多模态计算机可执行指令文本图像识别模块分析模块人体处理器可读存储介质安监系统图文行人检测对象数据文件夹格式精度

系统为您推荐了相关专利信息

储能电站的充放电策略确定方法以及装置

储能电站充放电策略计算机可执行指令充放电次数整数线性规划

应用于自动化黄芪精产线的设备状态数据管理方法及系统

产线设备设备状态数据设备运行趋势管理策略设备状态管理

基于NLP处理的文本可读性分析方法、系统及电子设备

复杂度特征依存句法树分析方法文本可读性分析密度

一种基于实心圆特征点的相机标定方法及系统

相机标定方法投影变换矩阵实心标定相机坐标系

一种智慧城市多租户管理方法、设备及介质

多租户管理方法政务云平台镜像资源

基于多模态大模型实现行人属性识别及评估的方法、装置、处理器及其计算机可读存储介质

站点导航

APP 下载