图像编码器的训练方法、图像处理方法、电子设备、存储介质和程序产品

AITNT
正文
推荐专利
图像编码器的训练方法、图像处理方法、电子设备、存储介质和程序产品
申请号:CN202510643368
申请日期:2025-05-19
公开号:CN120766199A
公开日期:2025-10-10
类型:发明专利
摘要
本申请实施例提供一种图像编码器的训练方法、图像处理方法、电子设备、存储介质和程序产品,涉及图像处理技术领域,图像编码器的训练方法包括:将训练图像输入图像编码器,通过所述图像编码器提取用于表示图像特征的视觉词符;针对训练图像生成衣物文本词符;所述衣物文本词符用于描述所述训练图像中人物的衣着特征;利用组合损失函数迭代训练所述图像编码器的模型参数;所述组合损失函数用于使人物相同的多张训练图像的视觉词符差异更小,且使同一张所述训练图像的视觉词符和所述衣物文本词符差异更大。通过引入文本模态,降低了对视觉信息的依赖程度,增加图像编码器识别不同衣着下同一人物的精度,提高了人物重识别的精度和鲁棒性。
技术关键词
图像编码器 衣物 视觉 图像处理方法 注意力神经网络 衣着 文本编码器 电子设备 可读存储介质 人物特征 图像处理技术 计算机程序产品 处理器 分类网络 参数 多模态 存储器 鲁棒性
系统为您推荐了相关专利信息
1
固定交通环境视觉内容管理系统
极限学习机神经网络 通知设备 解析装置 内容管理系统 图像处理
2
配送机器人和导航方法
配送机器人 电子导航装置 拾取机构 夹持组件 开关门组件
3
表征动态融合和记忆信息恢复的高效视觉图像生成方法
图像生成方法 文本编码器 比率 图像解码器 令牌
4
基于船载雷达图像与视觉图像融合的实时高精度测波方法
船载雷达图像 可见光图像 雷达回波图像 测波方法 雷达天线
5
一种面向长视频理解的采样方法及系统
令牌 大语言模型 视频帧 采样方法 生成视频片段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号