基于大模型的布局生成方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510474907

申请日期：2025-04-15

公开号：CN120388163A

公开日期：2025-07-29

类型：发明专利

摘要

本公开提供了基于大模型的布局生成方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型、图像处理等技术领域，可应用于基于人工智能的内容生成等场景。具体实现方案为：通过目标检测模型与语义分割模型提取原始图像的视觉信息；将视觉信息转化为结构化数据，并利用空间关系编码将结构化数据转换为自然语言描述；基于自然语言描述和用户指令，构建多模态Prompt；将构建好的多模态Prompt输入大模型，得到大模型输出的目标对象在原始图像中的布局信息。本方案能提高布局生成的质量和效率。

技术关键词

自然语言多模态对象布局生成方法语义分割模型指令偏差信息验证图像分割算法编码关系电子设备处理器人工智能技术计算机程序产品计算机视觉

系统为您推荐了相关专利信息

交通场景构建方法、电子设备、存储介质及程序产品

交通场景构建方法运动轨迹数据计算机执行指令对象

基于AIOT与图像识别的工程安全交底智能记录方法及系统

记录方法任务调度算法上下文语义信息关键词会议

显示控制装置、显示装置以及显示控制方法

虚拟对象显示控制装置尺寸显示控制方法观察者

用于对对象进行分类以防止恶意活动传播的系统和方法

对象分类规则非暂时性计算机可读介质机器学习模型计算机可执行指令

一种变胞结构多模态的水空跨介质机器人及其控制方法

航模电机模型预测控制策略多模态介质水下无线光通信技术

基于大模型的布局生成方法、装置、电子设备及存储介质

站点导航

APP 下载