文本描述的生成方法、装置和电子设备

AITNT
正文
推荐专利
文本描述的生成方法、装置和电子设备
申请号:CN202411971712
申请日期:2024-12-30
公开号:CN119992489A
公开日期:2025-05-13
类型:发明专利
摘要
本发明提供了一种文本描述的生成方法、装置和电子设备,其中,方法包括:获取目标车辆拍摄的多个第一视角图像;基于多个第一视角图像,合成包含目标车辆的第三视角图像;其中,第三视角图像中包括目标车辆在指定视角下的完整部位;将第三视角图像输入至预先训练完成的描述生成模型中,输出目标车辆对应的文本描述;其中,描述生成模型预先使用样本图像进行训练,样本图像为指定车辆的第三视角图像;文本描述包括目标车辆的行为描述和/或环境描述。该方式中,该方式将多个第一视角图像进行合成以得到第三视角图像,第三视角图像与预先训练完成的模型兼容,提高了生成的文本描述的准确率。
技术关键词
视角 计算机可执行指令 车辆 三维场景模型 文本 生成方法 摄像机 对象 样本 电子设备 图像获取模块 处理器 可读存储介质 颜色 指标 线条 数据 相机 生成装置
系统为您推荐了相关专利信息
1
一种基于初始位置引导和相邻特征增强网络的伪装目标检测方法
多视角特征 代表 更新网络参数 注意力 Sigmoid函数
2
共享充电机器人
智能充电模块 充电机器人 轨道装置 驱动组件 移动装置
3
基于视觉语言大模型的知识检索方法、系统、设备及产品
知识检索方法 语句 字段 实体 排序模型
4
一种基于大语言模型和强化学习的多干扰项生成方法
大语言模型 生成方法 文本 解码器 指令
5
基于ByT5的语音合成方法、装置、设备及存储介质
生成对抗网络 句法结构 文本特征向量 语音 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号