一种基于Token的视觉任务生成方法

正文

推荐专利

一种基于Token的视觉任务生成方法

申请号：CN202510601479

申请日期：2025-05-12

公开号：CN120631525A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种基于Token的视觉任务生成方法，属于智能任务自动化技术领域，其包括：S1、跨模态对齐；S2、视觉Token化；S3、任务描述Token序列构建：基于预先定义的视觉任务模板库，根据用户的需求或特定的应用场景，构建任务描述Token序列；S4、任务可行性校验；S5、任务优先级调度；S6、任务生成模型训练；S7、动态任务分配；S8、模型优化。本发明通过分层合并策略优化长序列处理能力，在保留空间位置信息的同时实现特征表达的紧凑性，线性投影与增强位置编码相结合形成具有强表征能力的视觉Token序列，既包含局部细节特征又保持全局上下文关系，为后续任务处理提供高信息密度的特征输入，有效提升各类视觉算法的处理精度。

技术关键词

生成方法序列跨模态文本图像视觉算法动态分配策略模板视觉数据集局部细节特征视觉特征多维特征向量联合损失函数语义分割网络分布式训练注意力编码复杂度

系统为您推荐了相关专利信息

识别信息生成方法、装置、电子设备和计算机可读介质

动作特征对象图像特征信息动作识别模型序列

训练垂域大模型的方法、装置及存储介质

查询意图语义文本输入结构数据

一种肺部肿瘤CT图像去噪方法、系统及装置

CT图像去噪方法肿瘤CT图像编码结构解码结构编码器

基于深度强化学习的伤口识别检测方法、系统及云平台

图像识别检测方法深度强化学习形状特征信息伤口边缘

一种基于层次化注意力机制的机器人动作序列生成方法

序列注意力机制关节解码器编码器

一种基于Token的视觉任务生成方法

站点导航

APP 下载