基于视觉分割和多模态大模型的气泡图生成方法

正文

推荐专利

申请号：CN202511430520

申请日期：2025-10-09

公开号：CN120912711A

公开日期：2025-11-07

类型：发明专利

摘要

本申请提供了一种基于视觉分割和多模态大模型的气泡图生成方法，其中，该方法包括：获取目标图像，并将目标图像输入预先训练得到的参数识别模型中，识别得到目标图像中的参数信息；将目标图像以及参数信息输入预先训练得到的目标视觉分割模型中，由目标视觉分割模型从目标图像中分割出至少一个分割后图像；根据各分割后图像以及预先训练得到的多模态大模型，在目标图像上生成气泡图。本申请能够准确理解各分割后图像中参数的语义，并进行结构化整理与输出，从而直观展示气泡图，辅助质检与分析。并且，还能达到提升对复杂图纸中细小参数区域的识别精度、更好地适应不同类型的图像风格以及在有限训练资源下实现高效微调，避免过拟合的技术效果。

技术关键词

多层感知器生成方法编码特征视觉矩阵气泡图像编码器参数识别模型机器可读指令解码器图像特征编码文本编码器生成解码电子设备处理器存储器样本