使用机器学习模型生成图像描述的方法、系统和存储介质

正文

推荐专利

申请号：CN202510547898

申请日期：2025-04-28

公开号：CN120877032A

公开日期：2025-10-31

类型：发明专利

摘要

本公开描述了用于使用机器学习模型生成图像描述的技术。专家混合(MoE)块被合并到机器学习模型的多个子模型中。机器学习模型的第一子模型包括至少一个第一MoE块，第一MoE块包括第一多个专家。机器学习模型的第二子模型包括至少一个第二MoE块，第二MoE块包括第二多个专家。仅第一多个专家的子集被激活以基于输入图像生成视觉标记。仅第二多个专家的子集被激活以将视觉标记投影到第三子模型的输入空间中。通过机器学习模型的第三子模型输出输入图像的文字描述。

技术关键词

机器学习模型计算机可读指令标记图像视觉特征非暂态计算机可读存储介质文本生成高分辨率路由器处理器分块金字塔注意力阶段参数存储器通道数据

系统为您推荐了相关专利信息

大麻二酚类似物CIAC001在制备治疗阿尔兹海默症药物中的应用

阿尔兹海默症药物大麻 NMDA受体拮抗剂针筒胆碱酯酶抑制剂

一种光测实景模拟训练方法及系统

模拟训练方法单杆方位角像素串口卡

一种特种工程施工现场图像数据集的构建方法与系统

高清摄像头双目相机图像工程施工现场机械设备

一种基于收益值的遥感数据覆盖筛选方法

筛选方法覆盖算法单轨遥感图像数据贪心算法

一种姿态可控生成方法及相关装置

自然语言文本姿态可控热力图关键点生成方法

使用机器学习模型生成图像描述的方法、系统和存储介质

站点导航

APP 下载