基于扩散模型的细粒度图像聚类模型的训练方法及细粒度图像聚类方法

正文

推荐专利

申请号：CN202411916239

申请日期：2024-12-24

公开号：CN119672385B

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了基于扩散模型的细粒度图像聚类模型的训练方法及细粒度图像聚类方法。本训练方法通过预训练的扩散模型先对细粒度图像聚类模型的语义提取器进行训练，并在训练过程中通过注意力机制形成去背景的蒙板，可以对扩散目标进行规范化，帮助文本条件精确聚焦于对象语义，实现对语义提取器的快速预优化；在语义提取器先进行单独优化后，再加入聚类损失对细粒度图像聚类模型的语义提取器和聚类头共同进行训练优化，可以使语义提取器得到的代理词与聚类目标对齐，实现有效图像分组。本训练方法无需进行数据增广，同时解决了冗余背景信息过多的问题，使得训练后的细粒度图像聚类模型可以准确进行细粒度图像聚类。

技术关键词

噪声图像图像聚类方法文本编码器高斯概率密度函数语义表达式高斯混合模型注意力机制特征生成图像网络中间层样本生成噪声噪声强度

系统为您推荐了相关专利信息

结合需求语义分析的智能咨询方法及咨询平台

语义检索模型语义标签关键词分词咨询平台

一种动态环境自适应语义通信系统及方法

特征提取器矢量量化通信系统索引联合信源信道编码

一种基于扩散模型的PCB异常检测方法、装置及设备

异常检测方法交叉注意力机制语义向量重构风格

基于图像识别的道路桥梁伸缩缝缺陷检测系统

道路桥梁伸缩缝缺陷检测系统 SIFT特征点子模块实时图像采集

一种基于知识图谱的电力服务语义识别方法及系统

语义识别方法图谱电力安监风险因子

基于扩散模型的细粒度图像聚类模型的训练方法及细粒度图像聚类方法

站点导航

APP 下载