一种基于多尺度Tsallis熵与低级视觉特征引导的ViT语义分割渐进式Token剪枝方法及系统

正文

推荐专利

申请号：CN202511004362

申请日期：2025-07-21

公开号：CN120851110A

公开日期：2025-10-28

类型：发明专利

摘要

一种基于多尺度Tsallis熵与低级视觉特征引导的ViT语义分割渐进式Token剪枝方法及系统，方法包括：使用Patch Embedding块嵌入将输入图像分割成多个固定大小的Patch块，并将每个Patch块转换为一个固定维度的特征向量；使用Transformer堆叠层捕获Patch Embedding块嵌入输出的特征向量，并进行特征提取，以产生经特征提取的Token序列；在每两个相邻Transformer层之间对Token序列执行渐进式Token修剪，包括一级熵值聚类和二级边缘引导聚类；得到语义信息复杂的Token序列，继续向后传播；利用分割头对最后一层Transformer层的Token序列进行图像分割操作，输出最终的分割图像；系统包括：Patch Embedding块嵌入、Transformer堆叠层、渐进式Token修剪模块和分割头；本发明保证性能的基础上，加速模型推理，降低部署门槛。

技术关键词

剪枝方法视觉特征图像分割多尺度前馈神经网络序列堆叠层语义聚类注意力机制动态可调矩阵代表上采样因子特征值非线性分辨率

系统为您推荐了相关专利信息

一种车载环境感知传感器控制方法和装置

视觉传感器激光雷达车载环境感知传感器点云缺失数据

基于自适应特征聚合的跨模态行人重识别方法

可见光图像重识别方法分类器细粒度特征 ResNet网络

一种基于用户视频数据的分类方法、设备及介质

关键帧分类方法视频特征提取神经网络分类空间特征提取

一种遥感影像多源异构数据融合处理方法及系统

多源异构数据融合局部特征信息遥感影像数据图像局部特征语义

一种变压器声纹数据去噪方法、系统、设备和存储介质

数据去噪方法噪声去噪系统变压器多尺度

一种基于多尺度Tsallis熵与低级视觉特征引导的ViT语义分割渐进式Token剪枝方法及系统

站点导航

APP 下载