摘要
本申请涉及图像处理领域,公开了基于CNN与Transformer的新媒体影像智能标注深度学习系统及方法,包括所述系统包括:输入模块,用于接收和加载新媒体影像数据;多级预处理模块,与所述输入模块连接,用于对影像数据进行多级处理,包括去噪、图像增强和标准化;多通道特征提取模块,与所述多级预处理模块连接,用于通过多个并行的卷积神经网络(CNN)架构提取不同语义层次的影像特征。通过多级预处理模块的去噪、图像增强和标准化处理,提高了影像数据的质量,从而提升了整体处理精度和效率,多模态融合模块通过融合多个语义层次的特征并结合注意力机制,从而更好地提取影像中的关键信息,提高标注的准确性和鲁棒性。
技术关键词
深度学习系统
影像
注意力机制
特征提取模块
媒体
输入模块
多层次
图像增强
对象识别
多模态
深度学习方法
多通道
生成对抗网络
标注策略
序列
图像缩放
语义
数据
系统为您推荐了相关专利信息
监控虚拟机
数据预测模型
性能指标监控方法
性能指标数据
告警机制
动作识别方法
动作识别模型
关键帧提取方法
时序
通道注意力机制
URL检测方法
统计特征提取
子模块
字符
训练分类器
时间序列预测模型
时间序列预测方法
交通
加权特征
嵌入方法
手语特征
运动特征
视觉特征
手语翻译方法
训练神经网络