基于视觉分割和多模态大模型的气泡图生成方法

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
基于视觉分割和多模态大模型的气泡图生成方法
申请号:CN202511430520
申请日期:2025-10-09
公开号:CN120912711A
公开日期:2025-11-07
类型:发明专利
摘要
本申请提供了一种基于视觉分割和多模态大模型的气泡图生成方法,其中,该方法包括:获取目标图像,并将目标图像输入预先训练得到的参数识别模型中,识别得到目标图像中的参数信息;将目标图像以及参数信息输入预先训练得到的目标视觉分割模型中,由目标视觉分割模型从目标图像中分割出至少一个分割后图像;根据各分割后图像以及预先训练得到的多模态大模型,在目标图像上生成气泡图。本申请能够准确理解各分割后图像中参数的语义,并进行结构化整理与输出,从而直观展示气泡图,辅助质检与分析。并且,还能达到提升对复杂图纸中细小参数区域的识别精度、更好地适应不同类型的图像风格以及在有限训练资源下实现高效微调,避免过拟合的技术效果。
技术关键词
多层感知器 生成方法 编码特征 视觉 矩阵 气泡 图像编码器 参数识别模型 机器可读指令 解码器 图像特征编码 文本编码器 生成解码 电子设备 处理器 存储器 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号