摘要
本发明提供了一种基于视觉任务处理的数据预处理方法、视觉任务处理方法及任务平台,包括获取目标视觉任务的输入图像;通过预设数据库对输入图像进行特征提取,获得图像特征和目标框特征;基于图像特征生成第一参考提示词、基于目标框特征生成第二参考提示词、基于图像特征和图像框特征在预设数据库中获得输入参考图像,并将输入图像、输入参考图像、第一参考提示词、第二参考提示词存储为处理目标视觉任务的待用数据。本发明解决了多源异构数据成本耗费较大,且通用视觉模型精度不足的问题。
技术关键词
数据预处理方法
视觉
数据标签
图像编码器
数据预处理装置
语义特征
检测解码器
文本编码器
平台
处理器
计算机程序产品
接口
对象
图像处理
可读存储介质
系统为您推荐了相关专利信息
设备故障检测方法
故障检测模型
多模态
采集设备
设备故障检测装置
CT重建方法
上下文语义信息
视觉特征提取
CT图像重建技术
迁移学习技术