基于图文双控的高速道路场景下的图像样本生成方法

AITNT
正文
推荐专利
基于图文双控的高速道路场景下的图像样本生成方法
申请号:CN202511261383
申请日期:2025-09-04
公开号:CN120747907B
公开日期:2025-12-12
类型:发明专利
摘要
本公开提供了一种基于图文双控的高速道路场景下的图像样本生成方法,涉及自动驾驶、大语言模型、混合专家模型、图像生成等人工智能技术领域。该方法包括:根据高速道路场景下的历史图像样本确定背景图,并在背景图上添加掩码得到掩码添加图;得到与目标道路元素的文本描述对应的文本特征;生成与目标道路元素相关的预设道路元素的参考图对应的图像特征;将文本特征和图像特征通过混合专家模型确定对应的特征权重,并按相应的特征权重进行加权计算,得到综合特征;将综合特征和掩码添加图共同作为输入信息输入预设的扩散模型,得到在掩码添加图中掩码所在位置上添加有目标道路元素的图像的增量图像样本。应用该方法可有效扩增样本数量。
技术关键词
背景图 样本生成方法 元素 场景 图文 文本编码器 障碍物方位 道路标识牌 图像生成单元 车道 处理器 多模态 大语言模型 人工智能技术 尺寸特征 计算机
系统为您推荐了相关专利信息
1
一种基于虚拟现实设备的运动辅助方法、装置及设备
虚拟现实场景 虚拟现实设备 数据监测设备 动作捕捉设备 控制虚拟现实
2
一种跨芯片架构的AI模型蒸馏迁移边缘部署方法
芯片架构 蒸馏 场景 教师 剪枝模型
3
一种农作物智能种植决策方法及系统
农作物智能 决策方法 农作物信息 非暂态计算机可读存储介质 利润
4
LED光源在不同场景中的色温自动调整方法
色温调控 多用户 变化检测算法 神经网络模型 场景
5
防渗墙施工进度同步更新的BIM模型匹配方法及系统
模型匹配方法 可视化数据集 数字孪生 防渗墙施工 区块链系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号