摘要
本发明公开了一种基于计算机视觉生成多场景车辆图片的方法、设备和介质,方法包括以下步骤:获取预设目标车辆图片;对预设目标车辆图片进行图片清洗、图片切片和图片打标操作,构建车辆图片数据集;使用所构建车辆图片数据集对计算机视觉模型进行训练,得到完成训练的计算机视觉模型;接收用户输入的场景提示词;通过完成训练的计算机视觉模型得到具有目标场景的目标车辆图片。本发明利用先进的图像识别、处理技术和计算机视觉算法,能够自动地将单一的车辆图片转换为车辆在多种不同场景下的图片,减少了现场拍摄的人工成本和运输成本,提高了车辆宣传图片的制作效率,缩短了制作周期。
技术关键词
图片
车辆
多场景
文本编码器
图像重建
计算机视觉算法
多标签
解码器
分辨率
场景类别
切片
误差函数
随机噪声
数据
处理器
可读存储介质
程序
系统为您推荐了相关专利信息
自动驾驶系统
性能评估系统
遮挡装置
车辆传感器
故障警告信息
车辆碰撞检测方法
融合视觉
多模态特征
音视频
多模态协同
分布式驱动车辆
纵向控制方法
前轴
高精度跟踪控制
非线性动力学模型
文本特征向量
图像编码器
前馈神经网络
视觉
文本编码器