基于扩散模型的细粒度图像聚类模型的训练方法及细粒度图像聚类方法

AITNT
正文
推荐专利
基于扩散模型的细粒度图像聚类模型的训练方法及细粒度图像聚类方法
申请号:CN202411916239
申请日期:2024-12-24
公开号:CN119672385B
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了基于扩散模型的细粒度图像聚类模型的训练方法及细粒度图像聚类方法。本训练方法通过预训练的扩散模型先对细粒度图像聚类模型的语义提取器进行训练,并在训练过程中通过注意力机制形成去背景的蒙板,可以对扩散目标进行规范化,帮助文本条件精确聚焦于对象语义,实现对语义提取器的快速预优化;在语义提取器先进行单独优化后,再加入聚类损失对细粒度图像聚类模型的语义提取器和聚类头共同进行训练优化,可以使语义提取器得到的代理词与聚类目标对齐,实现有效图像分组。本训练方法无需进行数据增广,同时解决了冗余背景信息过多的问题,使得训练后的细粒度图像聚类模型可以准确进行细粒度图像聚类。
技术关键词
噪声图像 图像聚类方法 文本编码器 高斯概率密度函数 语义 表达式 高斯混合模型 注意力机制 特征生成图像 网络 中间层 样本 生成噪声 噪声强度
系统为您推荐了相关专利信息
1
结合需求语义分析的智能咨询方法及咨询平台
语义检索模型 语义标签 关键词 分词 咨询平台
2
一种动态环境自适应语义通信系统及方法
特征提取器 矢量量化 通信系统 索引 联合信源信道编码
3
一种基于扩散模型的PCB异常检测方法、装置及设备
异常检测方法 交叉注意力机制 语义向量 重构 风格
4
基于图像识别的道路桥梁伸缩缝缺陷检测系统
道路桥梁伸缩缝 缺陷检测系统 SIFT特征点 子模块 实时图像采集
5
一种基于知识图谱的电力服务语义识别方法及系统
语义识别方法 图谱 电力安监 风险 因子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号