摘要
本发明公开了一种基于对比学习的图像美学多属性评论生成方法,涉及图像处理技术领域,包括以下步骤:采集图像及对应美学评论,构建图像‑文本多属性美学数据集;构建基于CLIP和多模态文本解码器的网络架构的图像美学多属性评论生成模型;利用图像‑文本多属性美学数据集和DPC2022数据集采用双阶段预训练策略训练图像美学多属性评论生成模型;将待评论图像输入训练后的图像美学多属性评论生成模型,获得图像美学多属性评论。本发明能够快速为图像生成一个有意义且有成效的美学语言描述。
技术关键词
美学
评论生成方法
文本编码器
图像编码器
二分类模型
数据
图像嵌入
关键词
解码器
网络架构
样本
标志位
多模态
分词
图像处理技术
视觉特征
策略
阶段
系统为您推荐了相关专利信息
特征提取模块
异常检测方法
融合特征
检测头
文本编码器
评论显示方法
评论生成方法
兴趣点属性信息
多模态特征
评论情感倾向