一种基于文本提炼与多粒度对齐的CLIP的图像美学评价方法

正文

推荐专利

申请号：CN202411974689

申请日期：2024-12-30

公开号：CN119904552A

公开日期：2025-04-29

类型：发明专利

摘要

本发明涉及一种基于文本提炼与多粒度对齐的CLIP的图像美学评价方法，属于图像处理以及计算机视觉领域。所述方法，利用现有的大语言模型对美学数据集中的用户评论进行文本提炼，从中分析并概括出与美学相关的核心描述，进而构建美学摘要数据集；其次，设计多粒度对齐的CLIP框架，基于该框架利用配对的图像‑详细评论‑美学摘要对原始的CLIP模型进行微调，使模型更好地理解美学领域中图像与文本描述之间的语义关系，从而学习到更加丰富的美学特征表示，获得针对美学任务的优化后的CLIP模型；最后，基于微调后的CLIP模型设计图像美学质量评价网络，以实现对图像美学质量的有效预测。本发明避免了跨模态美学评价方法在推理阶段需要同时输入图像文本对的问题。

技术关键词

图像美学评价方法文本编码器图像编码器摘要适配器大语言模型反向传播方法数据累积分布函数矩阵网络计算机程序指令美学特征主成分分析方法分支输出特征序列

系统为您推荐了相关专利信息

一种基于AI大模型的配电网智能调度方法及系统

配电网运行状态智能调度方法历史运行数据多任务神经网络故障检测

一种基于PEGASUS模型与动态纠错的双阶段文本摘要生成方法

文本摘要生成方法 GRU神经网络动态纠错 Word2Vec模型语义特征

一种基于多智能体协同推理的长文档处理方法及系统

多智能体协同答案列表逻辑文本

一种车内语音摘要提取的方法及系统

文本矩阵信息熵车辆导航路线摘要提取模块

一种基于多模态动态引导与拓扑的蔗尾实时计数方法

计数方法多模态密度图像拓扑特征

一种基于文本提炼与多粒度对齐的CLIP的图像美学评价方法

站点导航

APP 下载