基于专家混合模型的遥感图像的视觉语言处理方法及系统

正文

推荐专利

申请号：CN202411821058

申请日期：2024-12-11

公开号：CN119904742A

公开日期：2025-04-29

类型：发明专利

摘要

本申请公开了一种基于专家混合模型的遥感图像的视觉语言处理方法及系统，涉及数据处理、人工智能技术，包括：获取遥感图像数据；利用结合专家混合框架的视觉语言模型RS‑MoE，基于所述遥感图像数据生成描述性文本，所述RS‑MoE包括图像编码器(Image Encoder)、VLM编码器(VLM Encoder)和专家混合模块(MoE Block)，其中MoE Block包括动态生成任务提示的说明路由器(Instruction Router)和多个大语言模型(LLMs)。基于本申请实施例的视觉语言模型实现对所输入的遥感图像提供细致且符合上下文的描述，全面反映遥感场景。

技术关键词

图像编码器遥感图像数据视觉特征混合模块大语言模型路由器注意力感知特征人工智能技术文本动态存储器处理器框架场景阶段网络

系统为您推荐了相关专利信息

一种基于元数据与大语言模型的数据质量监测方法及装置

大语言模型数据词语文本深层语义匹配

基站信息处理方法及装置

基站能力信息信息处理方法大语言模型交通监控文本

图像描述生成方法、装置、设备以及存储介质

视觉特征语义特征检索图像文本多模态数据库

基于无人机影像评估甘蔗黑穗病的方法

甘蔗黑穗病影像光谱特征提取视觉特征提取无人机

一种私有化部署大语言模型安全管理的方法及装置

大语言模型审计日志机器可读程序集成访问控制时间滑动窗口

基于专家混合模型的遥感图像的视觉语言处理方法及系统

站点导航

APP 下载