基于CNN与Transformer的新媒体影像智能标注深度学习系统及方法

正文

推荐专利

申请号：CN202410765494

申请日期：2024-06-14

公开号：CN118447371A

公开日期：2024-08-06

类型：发明专利

摘要

本申请涉及图像处理领域，公开了基于CNN与Transformer的新媒体影像智能标注深度学习系统及方法，包括所述系统包括：输入模块，用于接收和加载新媒体影像数据；多级预处理模块，与所述输入模块连接，用于对影像数据进行多级处理，包括去噪、图像增强和标准化；多通道特征提取模块，与所述多级预处理模块连接，用于通过多个并行的卷积神经网络（CNN）架构提取不同语义层次的影像特征。通过多级预处理模块的去噪、图像增强和标准化处理，提高了影像数据的质量，从而提升了整体处理精度和效率，多模态融合模块通过融合多个语义层次的特征并结合注意力机制，从而更好地提取影像中的关键信息，提高标注的准确性和鲁棒性。

技术关键词

深度学习系统影像注意力机制特征提取模块媒体输入模块多层次图像增强对象识别多模态深度学习方法多通道生成对抗网络标注策略序列图像缩放语义数据

系统为您推荐了相关专利信息

性能指标监控方法、装置、设备及存储介质

监控虚拟机数据预测模型性能指标监控方法性能指标数据告警机制

一种基于时序建模的可部署边缘设备的轻量级动作识别方法

动作识别方法动作识别模型关键帧提取方法时序通道注意力机制

一种基于EMO-GAN的恶意URL检测方法

URL检测方法统计特征提取子模块字符训练分类器

基于低秩分解和动态增强的时间序列预测方法及装置

时间序列预测模型时间序列预测方法交通加权特征嵌入方法

手语翻译方法、装置、计算机设备及存储介质

手语特征运动特征视觉特征手语翻译方法训练神经网络

基于CNN与Transformer的新媒体影像智能标注深度学习系统及方法

站点导航

APP 下载