信息处理装置以及模型训练、图像编辑方法、电子设备

正文

推荐专利

申请号：CN202510689577

申请日期：2025-05-27

公开号：CN120726181A

公开日期：2025-09-30

类型：发明专利

摘要

本申请实施例公开了信息处理装置以及模型训练、图像编辑方法、电子设备，所述装置包括AI模型，所述AI模型以预训练的AI语言模型作为骨干网络；视觉编码模块用于对输入的视觉内容进行视觉编码，得到视觉特征向量；适配模块用于将视觉特征向量进行与文本特征向量的维度对齐处理；AI语言模型用于根据所述文本特征向量和/或维度对齐处理后的视觉特征向量进行处理，输出文本特征向量和/或视觉特征向量；所述视觉解码模块用于根据所述AI语言模型输出的文本特征向量和/或视觉特征向量进行视觉内容的生成。通过本申请实施例，能够通过同一个AI模型完成多模态内容理解、基于文本生成图像、图像编辑等多种不同的复杂任务。

技术关键词

文本特征向量解码模块文本生成图像视觉图像编辑方法信息处理装置多模态编码模块计算机可执行指令人工智能AI模型数据阶段理解自然语言拼接模块生成自然语言电子设备

系统为您推荐了相关专利信息

基于计算机视觉的药品表面微生物污染检验测方法

相位特征融合纹理特征计算机视觉通道可见光图像

一种基于姿态信息重构的无人机飞行控制系统

加权融合算法飞行控制模块传感器噪声重构模块视觉

基于多模态融合的深井铸造铝液泄漏检测方法

泄漏检测方法积层融合特征铝液编码特征

一种穴位识别标记方法、系统、电子设备及存储介质

穴位名称识别标记图像跟踪算法深度神经网络模型视觉惯性里程计

一种基于HTML5 Canvas的图像处理系统及方法

图像处理系统自动标记图像处理方法视频流对象跟踪

信息处理装置以及模型训练、图像编辑方法、电子设备

站点导航

APP 下载