基于统一信息流的掩码图像建模自监督学习方法及装置

AITNT
正文
推荐专利
基于统一信息流的掩码图像建模自监督学习方法及装置
申请号:CN202411086736
申请日期:2024-08-08
公开号:CN119206427A
公开日期:2024-12-27
类型:发明专利
摘要
本发明提供一种基于统一信息流的掩码图像建模自监督学习方法及装置,方法包括:对自监督学习任务的待处理图像进行图像分块化得到等分像素块;调用特征编码器对等分像素块进行基于信息流的解耦处理,得到深层表征信息;基于分形空间填充曲线范式,对深层表征信息进行分形序列构建,得到分形序列表征信息,并调用特征解码器解码得到特征预测值;将特征预测值进行线性映射处理,得到自监督学习任务的目标预测结果,并构建自监督学习损失值,用于对所述自监督学习模型进行训练。通过本申请,解决了现有技术在图像特征构建时,未关注图像块特征之间的依赖关系及图像模态二维特性,导致掩码图像建模时图像表征学习能力下降,且通用性差的问题。
技术关键词
监督学习方法 像素块 空间填充曲线 监督学习模型 编码器 序列 非暂态计算机可读存储介质 解码器 交叉注意力机制 图像块特征 分块 处理器 学习装置 计算机程序产品 线性
系统为您推荐了相关专利信息
1
一种基于图重构与空间自注意力的降水预测图卷积方法
卷积方法 重构 注意力编码器 注意力机制 滑动窗口
2
基于潜在扩散模型的语音合成方法、装置、服务器及介质
语音 情感特征 音频解码器 文本 音频编码器
3
基于移动终端系统的IC卡交易安全处理方法及系统
移动终端系统 高维特征向量 IC卡 交易风险预测 编码器
4
基于大核注意力机制的医学图像融合方法及系统
医学图像融合方法 注意力机制 多模态医学图像 空间特征提取 多尺度
5
基于元数据增强的语音识别模型预训练方法、语音识别方法及系统
语音识别模型 预训练方法 数据 编码器适配器 语音识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号