摘要
本发明提供了一种文本描述的生成方法、装置和电子设备,其中,方法包括:获取目标车辆拍摄的多个第一视角图像;基于多个第一视角图像,合成包含目标车辆的第三视角图像;其中,第三视角图像中包括目标车辆在指定视角下的完整部位;将第三视角图像输入至预先训练完成的描述生成模型中,输出目标车辆对应的文本描述;其中,描述生成模型预先使用样本图像进行训练,样本图像为指定车辆的第三视角图像;文本描述包括目标车辆的行为描述和/或环境描述。该方式中,该方式将多个第一视角图像进行合成以得到第三视角图像,第三视角图像与预先训练完成的模型兼容,提高了生成的文本描述的准确率。
技术关键词
视角
计算机可执行指令
车辆
三维场景模型
文本
生成方法
摄像机
对象
样本
电子设备
图像获取模块
处理器
可读存储介质
颜色
指标
线条
数据
相机
生成装置
系统为您推荐了相关专利信息
多视角特征
代表
更新网络参数
注意力
Sigmoid函数
智能充电模块
充电机器人
轨道装置
驱动组件
移动装置
生成对抗网络
句法结构
文本特征向量
语音
融合特征