基于扩散模型生成数据的模型量化方法以及装置

AITNT
正文
推荐专利
基于扩散模型生成数据的模型量化方法以及装置
申请号:CN202411124196
申请日期:2024-08-15
公开号:CN119026645A
公开日期:2024-11-26
类型:发明专利
摘要
本申请提出一种基于扩散模型生成数据的模型量化方法以及装置,其中,方法包括:获取高斯分布的数据集采样样本;基于高斯分布的数据集采样样本和待量化模型,通过扩散模型生成伪训练数据;扩散模型采用UNet网络结构作为核心架构,UNet网络结构的编码器后端加入多头注意力机制,多头注意力机制用于建立特征图中各元素间的关联关系,以使UNet网络结构的感受野为整个图像;通过伪训练数据对待量化模型进行模型量化处理,得到低比特量化模型。以实现无训练数据的模型量化。
技术关键词
低比特量化 多头注意力机制 网络结构 计算机执行指令 数据 样本 搜索算法 噪声 编码器 可读存储介质 计算机程序产品 关系 处理器通信 采样模块 存储器 核心 元素 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号