自动驾驶边缘场景理解检索增强方法、设备及介质

正文

推荐专利

申请号：CN202510986983

申请日期：2025-07-17

公开号：CN120849647A

公开日期：2025-10-28

类型：发明专利

摘要

本发明涉及一种自动驾驶边缘场景理解检索增强方法、设备及介质，该方法包括：采用基于难负和半难负样本采样对比学习方法对跨模态向量嵌入模型进行微调训练；采用训练好的跨模态向量嵌入模型生成图像‑文本对的嵌入，采用文本编码模型生成文本描述的嵌入，分别存储于共享相同索引的多模态数据库和文本数据库；输入自动驾驶边缘场景实图形，生成图像‑文本对的嵌入，根据嵌入信息从多模态数据库中检索出最接近场景图像，与自动驾驶边缘场景与实图拼接，将拼接后的图像和最接近场景图像对应的文本描述以及设定提示语输入至视觉语言模型，得到消除幻觉的边缘场景理解。与现有技术相比，本发明可有效缓解边缘场景理解中存在的幻觉问题。

技术关键词

文本场景三元组学习方法样本图像嵌入表达式噪声梯度下降算法图像匹配索引信号处理器跨模态编码可读存储介质批量视觉存储器

系统为您推荐了相关专利信息

一种用于新能源负荷条件下的保供能力动态评估系统及方法

发电量动态评估系统新能源电网时序负荷预测模型

一种基于强迫提示词学习的视觉语言模型分布外检测方法及装置

外检测方法文本编码器图像编码器视觉训练集

基于智能视觉的磨抛轨迹自适应规划方法及装置

机器人控制器轨迹离线编程软件控制现场瑕疵

用户界面自动化测试方法、装置、设备及存储介质

测试用户界面自动化测试方法元素测试接口意图

一种基于扩散模型的自监督学习多模态推荐方法及系统

模态特征推荐方法多模态生成用户语义

自动驾驶边缘场景理解检索增强方法、设备及介质

站点导航

APP 下载