基于CNN与Transformer的新媒体影像智能标注深度学习系统及方法

AITNT
正文
推荐专利
基于CNN与Transformer的新媒体影像智能标注深度学习系统及方法
申请号:CN202410765494
申请日期:2024-06-14
公开号:CN118447371A
公开日期:2024-08-06
类型:发明专利
摘要
本申请涉及图像处理领域,公开了基于CNN与Transformer的新媒体影像智能标注深度学习系统及方法,包括所述系统包括:输入模块,用于接收和加载新媒体影像数据;多级预处理模块,与所述输入模块连接,用于对影像数据进行多级处理,包括去噪、图像增强和标准化;多通道特征提取模块,与所述多级预处理模块连接,用于通过多个并行的卷积神经网络(CNN)架构提取不同语义层次的影像特征。通过多级预处理模块的去噪、图像增强和标准化处理,提高了影像数据的质量,从而提升了整体处理精度和效率,多模态融合模块通过融合多个语义层次的特征并结合注意力机制,从而更好地提取影像中的关键信息,提高标注的准确性和鲁棒性。
技术关键词
深度学习系统 影像 注意力机制 特征提取模块 媒体 输入模块 多层次 图像增强 对象识别 多模态 深度学习方法 多通道 生成对抗网络 标注策略 序列 图像缩放 语义 数据
系统为您推荐了相关专利信息
1
性能指标监控方法、装置、设备及存储介质
监控虚拟机 数据预测模型 性能指标监控方法 性能指标数据 告警机制
2
一种基于时序建模的可部署边缘设备的轻量级动作识别方法
动作识别方法 动作识别模型 关键帧提取方法 时序 通道注意力机制
3
一种基于EMO-GAN的恶意URL检测方法
URL检测方法 统计特征提取 子模块 字符 训练分类器
4
基于低秩分解和动态增强的时间序列预测方法及装置
时间序列预测模型 时间序列预测方法 交通 加权特征 嵌入方法
5
手语翻译方法、装置、计算机设备及存储介质
手语特征 运动特征 视觉特征 手语翻译方法 训练神经网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号