一种基于扩散模型的曲线物体图像标签对的合成方法

AITNT
正文
推荐专利
一种基于扩散模型的曲线物体图像标签对的合成方法
申请号:CN202510736414
申请日期:2025-06-04
公开号:CN120673191A
公开日期:2025-09-19
类型:发明专利
摘要
本发明涉及计算机视觉技术领域,提供了一种基于扩散模型的曲线物体图像标签对的合成方法。方法包括:对图像块按照图像时间步进行马尔可夫扩散,得到加噪图像块;对标注块按照标注时间步进行马尔可夫扩散,得到加噪标注块;将加噪图像块、加噪标注块、图像模态掩码块、标注模态掩码块、图像时间步和标注时间步输入至基准模型进行训练,得到合成模型;使用合成模型对高斯噪声图像进行噪声预测,得到图像噪声和标注噪声,使用图像噪声和标注噪声对高斯噪声图像进行反向采样,生成合成图像和合成标注。本发明使训练得到的合成模型能够对图像和标注进行同步处理,从而同步生成合成图像和合成标注,确保了合成图像与合成标注之间的一致性。
技术关键词
图像块 噪声预测 噪声图像 代表 标签 曲线 物体 解码器 编码器 融合特征 计算机视觉技术 基准 多模态 噪声方差 通道 模块 参数
系统为您推荐了相关专利信息
1
基于多特征融合的人体运动姿态识别系统及其方法
人体运动姿态 时序特征 姿态监控 加速度 三维卷积神经网络模型
2
一种轻量级抗侧信道攻击的ASCON128加解密电路设计方法
抗侧信道攻击 电路设计方法 加解密算法 加密 资源共享
3
心肺复苏的急救指导方法和装置
标签页面 人工智能辅助 意图识别 音频 语句
4
非管理型交换机的配置方法、系统及存储介质
管理型交换机 NFC读卡器 配置标签 净荷数据 控制芯片
5
一种混合语音分离方法、装置、设备及可读存储介质
声纹特征 日志模型 语音 编码器 计算机可执行指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号