使用机器学习模型生成图像描述的方法、系统和存储介质

AITNT
正文
推荐专利
使用机器学习模型生成图像描述的方法、系统和存储介质
申请号:CN202510547898
申请日期:2025-04-28
公开号:CN120877032A
公开日期:2025-10-31
类型:发明专利
摘要
本公开描述了用于使用机器学习模型生成图像描述的技术。专家混合(MoE)块被合并到机器学习模型的多个子模型中。机器学习模型的第一子模型包括至少一个第一MoE块,第一MoE块包括第一多个专家。机器学习模型的第二子模型包括至少一个第二MoE块,第二MoE块包括第二多个专家。仅第一多个专家的子集被激活以基于输入图像生成视觉标记。仅第二多个专家的子集被激活以将视觉标记投影到第三子模型的输入空间中。通过机器学习模型的第三子模型输出输入图像的文字描述。
技术关键词
机器学习模型 计算机可读指令 标记 图像 视觉特征 非暂态计算机可读存储介质 文本 生成高分辨率 路由器 处理器 分块 金字塔 注意力 阶段 参数 存储器 通道 数据
系统为您推荐了相关专利信息
1
大麻二酚类似物CIAC001在制备治疗阿尔兹海默症药物中的应用
阿尔兹海默症药物 大麻 NMDA受体拮抗剂 针筒 胆碱酯酶抑制剂
2
一种光测实景模拟训练方法及系统
模拟训练方法 单杆 方位角 像素 串口卡
3
一种特种工程施工现场图像数据集的构建方法与系统
高清摄像头 双目相机 图像 工程施工现场 机械设备
4
一种基于收益值的遥感数据覆盖筛选方法
筛选方法 覆盖算法 单轨 遥感图像数据 贪心算法
5
一种姿态可控生成方法及相关装置
自然语言文本 姿态可控 热力图 关键点 生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号