图像编码器的训练方法、图像处理方法、电子设备、存储介质和程序产品

正文

推荐专利

申请号：CN202510643368

申请日期：2025-05-19

公开号：CN120766199A

公开日期：2025-10-10

类型：发明专利

摘要

本申请实施例提供一种图像编码器的训练方法、图像处理方法、电子设备、存储介质和程序产品，涉及图像处理技术领域，图像编码器的训练方法包括：将训练图像输入图像编码器，通过所述图像编码器提取用于表示图像特征的视觉词符；针对训练图像生成衣物文本词符；所述衣物文本词符用于描述所述训练图像中人物的衣着特征；利用组合损失函数迭代训练所述图像编码器的模型参数；所述组合损失函数用于使人物相同的多张训练图像的视觉词符差异更小，且使同一张所述训练图像的视觉词符和所述衣物文本词符差异更大。通过引入文本模态，降低了对视觉信息的依赖程度，增加图像编码器识别不同衣着下同一人物的精度，提高了人物重识别的精度和鲁棒性。

技术关键词

图像编码器衣物视觉图像处理方法注意力神经网络衣着文本编码器电子设备可读存储介质人物特征图像处理技术计算机程序产品处理器分类网络参数多模态存储器鲁棒性

系统为您推荐了相关专利信息

固定交通环境视觉内容管理系统

极限学习机神经网络通知设备解析装置内容管理系统图像处理

配送机器人和导航方法

配送机器人电子导航装置拾取机构夹持组件开关门组件

表征动态融合和记忆信息恢复的高效视觉图像生成方法

图像生成方法文本编码器比率图像解码器令牌

基于船载雷达图像与视觉图像融合的实时高精度测波方法

船载雷达图像可见光图像雷达回波图像测波方法雷达天线

一种面向长视频理解的采样方法及系统

令牌大语言模型视频帧采样方法生成视频片段

图像编码器的训练方法、图像处理方法、电子设备、存储介质和程序产品

站点导航

APP 下载