基于大语言模型的可控示意图生成方法、系统及存储介质

正文

推荐专利

申请号：CN202510276662

申请日期：2025-03-10

公开号：CN120219558A

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开了一种基于大语言模型的可控示意图生成方法、系统及存储介质，方法包括构建基于大语言模型的示意图生成任务数据集；根据示意图的图像特点预先建立示意图的布局规划规则，通过示意图的布局规划规则将基于大语言模型的示意图生成任务数据集转换为设定布局的示意图；对示意图的布局规划规则进行序列化处理，转换成文本表达形式，并定位文本表达形式的布局规划规则在图像中的应用区域；对应布局规划规则在图像中的应用区域，结合多模态嵌入表征和微调的扩散模型，优化序列化处理过程和图像生成过程，生成符合需求的示意图。本发明能够有效应对示意图生成过程中的高层语义复杂性及底层视觉多样性的挑战，提升示意图理解技术的整体质量。

技术关键词

大语言模型布局生成方法规划多模态注意力机制文本编码器预训练模型视觉生成数据集注意力模型理解技术可读存储介质标记噪声图像语义

系统为您推荐了相关专利信息

基于大模型数据蒸馏的数据库查询方法、系统、设备及介质

数据库查询方法轻量化神经网络数据库查询系统数据库执行计划蒸馏

一种买家之声细粒度意图分析与匹配方法及系统

文本意图数据匹配器聚类

一种基于AI助手的人员工作辅助方法及其系统

AI助手人工智能模型模拟沙盘工作辅助系统格式

一种充电桩布局方法、装置、设备、介质及产品

充电桩布局方法粒子群算法布局装置站点电车

一种基于引力遗传搜索算法的卫星任务规划方法

引力搜索算法规划蒙特卡罗载荷地面站

基于大语言模型的可控示意图生成方法、系统及存储介质

站点导航

APP 下载