摘要
本发明涉及一种基于多模态大模型实现行人属性识别及评估的方法,包括以下步骤:人体识别模块识别确认输入图像中是否存在人体对象,并定位人体目标;行人属性分析模块在多模态大模型的基础上进行微调,分析图像中行人所具有的各项属性;输出质量评价模块通过预训练的行人属性图文匹配的clip模型,计算多模态大模型的输出文本与原始图像之间的余弦相似度;精度评估模块,检验模型输出文本中关于行人属性的准确性。采用了本发明的基于多模态大模型实现行人属性识别及评估的方法、装置、处理器及其计算机可读存储介质,能够准确地识别出行人属性,有效评估识别结果的质量,确保输出的可靠性和准确性,为智能安监系统的应用和发展提供强有力的技术支持。
技术关键词
行人属性识别
多模态
计算机可执行指令
文本
图像
识别模块
分析模块
人体
处理器
可读存储介质
安监系统
图文
行人检测
对象
数据
文件夹
格式
精度
系统为您推荐了相关专利信息
储能电站
充放电策略
计算机可执行指令
充放电次数
整数线性规划
产线设备
设备状态数据
设备运行趋势
管理策略
设备状态管理
复杂度特征
依存句法树
分析方法
文本可读性分析
密度
相机标定方法
投影变换矩阵
实心
标定相机
坐标系