一种基于Token的视觉任务生成方法

AITNT
正文
推荐专利
一种基于Token的视觉任务生成方法
申请号:CN202510601479
申请日期:2025-05-12
公开号:CN120631525A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种基于Token的视觉任务生成方法,属于智能任务自动化技术领域,其包括:S1、跨模态对齐;S2、视觉Token化;S3、任务描述Token序列构建:基于预先定义的视觉任务模板库,根据用户的需求或特定的应用场景,构建任务描述Token序列;S4、任务可行性校验;S5、任务优先级调度;S6、任务生成模型训练;S7、动态任务分配;S8、模型优化。本发明通过分层合并策略优化长序列处理能力,在保留空间位置信息的同时实现特征表达的紧凑性,线性投影与增强位置编码相结合形成具有强表征能力的视觉Token序列,既包含局部细节特征又保持全局上下文关系,为后续任务处理提供高信息密度的特征输入,有效提升各类视觉算法的处理精度。
技术关键词
生成方法 序列 跨模态 文本 图像 视觉算法 动态分配策略 模板 视觉数据集 局部细节特征 视觉特征 多维特征向量 联合损失函数 语义分割网络 分布式训练 注意力 编码 复杂度
系统为您推荐了相关专利信息
1
识别信息生成方法、装置、电子设备和计算机可读介质
动作特征 对象 图像特征信息 动作识别模型 序列
2
训练垂域大模型的方法、装置及存储介质
查询意图 语义 文本 输入结构 数据
3
一种肺部肿瘤CT图像去噪方法、系统及装置
CT图像去噪方法 肿瘤CT图像 编码结构 解码结构 编码器
4
基于深度强化学习的伤口识别检测方法、系统及云平台
图像 识别检测方法 深度强化学习 形状特征信息 伤口边缘
5
一种基于层次化注意力机制的机器人动作序列生成方法
序列 注意力机制 关节 解码器 编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号