摘要
本申请涉及人工智能技术领域,公开了一种素材处理方法、模型训练方法、装置及产品。该方法包括:按照第一间隔时间对待处理视频进行抽帧,得到多个待处理图像;检测各个待处理图像是否包含人物信息;在所述待处理图像包含人物信息的情况下,生成所述待处理图像中至少一个人物的边界框;根据所述待处理图像中的边界框,对所述待处理图像进行裁切得到对应的目标图像;将所述目标图像输入大语言模型,得到输出的所述目标图像的服装类别,为所述目标图像添加所述服装类别对应的类别标签,并将所述目标图像存储到目标数据库。采用本方法能够自动化、高效地收集高质量的服装素材图片,为服装模型提供高质量的训练样本。
技术关键词
服装类别
图像
大语言模型
服装模型
关键点
模型训练方法
标签
模型训练装置
人工智能技术
处理器
过滤模块
视频
风格
穿着
可读存储介质
存储器
场景
电子设备