基于图文双控的高速道路场景下的图像样本生成方法

正文

推荐专利

申请号：CN202511261383

申请日期：2025-09-04

公开号：CN120747907B

公开日期：2025-12-12

类型：发明专利

摘要

本公开提供了一种基于图文双控的高速道路场景下的图像样本生成方法，涉及自动驾驶、大语言模型、混合专家模型、图像生成等人工智能技术领域。该方法包括：根据高速道路场景下的历史图像样本确定背景图，并在背景图上添加掩码得到掩码添加图；得到与目标道路元素的文本描述对应的文本特征；生成与目标道路元素相关的预设道路元素的参考图对应的图像特征；将文本特征和图像特征通过混合专家模型确定对应的特征权重，并按相应的特征权重进行加权计算，得到综合特征；将综合特征和掩码添加图共同作为输入信息输入预设的扩散模型，得到在掩码添加图中掩码所在位置上添加有目标道路元素的图像的增量图像样本。应用该方法可有效扩增样本数量。

技术关键词

背景图样本生成方法元素场景图文文本编码器障碍物方位道路标识牌图像生成单元车道处理器多模态大语言模型人工智能技术尺寸特征计算机

系统为您推荐了相关专利信息

一种基于虚拟现实设备的运动辅助方法、装置及设备

虚拟现实场景虚拟现实设备数据监测设备动作捕捉设备控制虚拟现实

一种跨芯片架构的AI模型蒸馏迁移边缘部署方法

芯片架构蒸馏场景教师剪枝模型

一种农作物智能种植决策方法及系统

农作物智能决策方法农作物信息非暂态计算机可读存储介质利润

LED光源在不同场景中的色温自动调整方法

色温调控多用户变化检测算法神经网络模型场景

防渗墙施工进度同步更新的BIM模型匹配方法及系统

模型匹配方法可视化数据集数字孪生防渗墙施工区块链系统

基于图文双控的高速道路场景下的图像样本生成方法

站点导航

APP 下载