文本描述的生成方法、装置和电子设备

正文

推荐专利

文本描述的生成方法、装置和电子设备

申请号：CN202411971712

申请日期：2024-12-30

公开号：CN119992489A

公开日期：2025-05-13

类型：发明专利

摘要

本发明提供了一种文本描述的生成方法、装置和电子设备，其中，方法包括：获取目标车辆拍摄的多个第一视角图像；基于多个第一视角图像，合成包含目标车辆的第三视角图像；其中，第三视角图像中包括目标车辆在指定视角下的完整部位；将第三视角图像输入至预先训练完成的描述生成模型中，输出目标车辆对应的文本描述；其中，描述生成模型预先使用样本图像进行训练，样本图像为指定车辆的第三视角图像；文本描述包括目标车辆的行为描述和/或环境描述。该方式中，该方式将多个第一视角图像进行合成以得到第三视角图像，第三视角图像与预先训练完成的模型兼容，提高了生成的文本描述的准确率。

技术关键词

视角计算机可执行指令车辆三维场景模型文本生成方法摄像机对象样本电子设备图像获取模块处理器可读存储介质颜色指标线条数据相机生成装置

系统为您推荐了相关专利信息

一种基于初始位置引导和相邻特征增强网络的伪装目标检测方法

多视角特征代表更新网络参数注意力 Sigmoid函数

共享充电机器人

智能充电模块充电机器人轨道装置驱动组件移动装置

基于视觉语言大模型的知识检索方法、系统、设备及产品

知识检索方法语句字段实体排序模型

一种基于大语言模型和强化学习的多干扰项生成方法

大语言模型生成方法文本解码器指令

基于ByT5的语音合成方法、装置、设备及存储介质

生成对抗网络句法结构文本特征向量语音融合特征

文本描述的生成方法、装置和电子设备

站点导航

APP 下载