摘要
本申请公开了一种基于多模态多任务统一模型的图像处理方法,涉及图像处理技术领域,包括:获取待处理图像组、任务提示图像组以及任务提示图像组对应的标签图像,待处理图像组包括待处理主模态图像和待处理辅助模态图像,任务提示图像组包括任务提示主模态图像和任务提示辅助模态图像;将标签图像输入已训练的图像处理模型,以通过图像处理模型获取任务提示信息;将待处理图像组和任务提示图像组输入图像处理模型,以通过图像处理模型基于任务提示信息、待处理图像组和任务提示图像组进行图像处理并获得目标图像。在多模态多任务场景下可以使用同一个统一的图像处理模型进行处理,有利于降低处理过程的复杂性。
技术关键词
图像处理模型
图像处理方法
多任务
多模态
模态特征
图像处理程序
标签特征
标签编码器
图像编码器
融合特征
交叉注意力机制
智能终端
图像处理系统
可读存储介质
图像处理技术
数据获取模块
系统为您推荐了相关专利信息
航空发动机轴承
迁移诊断方法
多头注意力机制
模态特征
时空耦合关系
知识图谱补全方法
损失函数优化
多模态
语义
关系建模
动态评估系统
电力交易市场
多模态
物理设备
决策系统
植物群落调查
传感器吊舱
多模态
景观破碎度指数
多光谱相机
多路径传输方法
传输路径
视频帧
描述符
三维点云地图