基于多模态大模型的UI效果图识别方法、系统及介质

正文

推荐专利

申请号：CN202411687205

申请日期：2024-11-25

公开号：CN119206376B

公开日期：2025-09-02

类型：发明专利

摘要

本申请公开了基于多模态大模型的UI效果图识别方法、系统及介质，方法包括如下步骤：基于图像编码、多模态投影以及文本编码构建多模态预训练模型；根据历史图像数据以及多模态预训练模型执行微调训练，获取多模态大模型；基于内置组件数据结构构建向量数据库；获取待识别UI效果图，基于多模态大模型以及待识别UI效果图输出第一识别数据；利用检索算法针对第一识别数据搜寻向量数据库，输出对应待识别UI效果图的生成信息。本申请的有益效果：确保UI效果图生成一致性以及高效性。

技术关键词

多模态预训练模型识别方法融合视觉特征图像编码数据检索算法注意力文本图片构建知识图谱知识图谱构建调优技术分辨率插值方法语义特征识别系统

基于多模态大模型的UI效果图识别方法、系统及介质

站点导航

APP 下载