基于多模态大模型的电力图文交互方法、系统及相关设备

正文

推荐专利

申请号：CN202510177581

申请日期：2025-02-18

公开号：CN120125972A

公开日期：2025-06-10

类型：发明专利

摘要

一种基于多模态大模型的电力图文交互方法、系统及相关设备，涉及人工智能技术领域，电力图文交互方法包括收集电力图片与通用领域图片，对预先建立的电力视觉编码器进行训练；构建多模态大型语言模型，并通过训练完成的电力视觉编码器修改多模态大型语言模型自带的通用视觉编码器，得到电力图文大模型；构建电力图文多任务标注数据集，并对得到的电力图文大模型进行微调；使用微调之后的电力图文大模型，搭建服务，对输入的图片及问题进行回答。本发明在多模态大模型中引入专业领域的视觉编码器，将电力视觉编码器的输出特征送入一个新的视觉适配器，与通用视觉适配器特征对齐、融合后，送入解码器，提升了多模态大模型对专业领域图像的分析能力。

技术关键词

图文电力多模态交互方法变换器模块图片分辨率交互系统输出特征解码器适配器标记多任务视觉搭建模块图像重建方法数据

系统为您推荐了相关专利信息

融合物理约束与对抗网络的设备故障预测方法

设备故障预测方法多模态特征融合时序特征敏感性特征注意力机制

基于母线槽的程序控制方法及系统

寿命预测模型程序控制方法电力模块参数

一种融合多模态感知的三维情感共鸣交互系统

交互系统多模态微动特征多尺度特征提取交互内容

一种基于大模型的多模态RAG、装置、设备及存储介质

课件内容多模态技术分片索引文本

基于多模态感知与动态评估的沉浸式虚拟教学系统

虚拟教学系统教学场景数据处理模块数据采集模块注意力

基于多模态大模型的电力图文交互方法、系统及相关设备

站点导航

APP 下载