自动驾驶场景识别方法、装置、计算机设备、介质和产品

正文

推荐专利

申请号：CN202411519684

申请日期：2024-10-29

公开号：CN119540821A

公开日期：2025-02-28

类型：发明专利

摘要

本申请涉及一种自动驾驶场景识别方法、装置、计算机设备、介质和产品。所述方法包括：将待处理视频中的视频帧分割成多个图像补丁，根据视频帧和对应的文本数据，对模型进行预训练，在预设的注意力机制下，根据待处理视频生成视频代理令牌和补丁令牌，并对待处理视频帧进行编码处理，得到视频特征，通过训练得到的视频‑文本模型对文本数据进行编码，得到文本特征，以信息噪声对比估计函数作为损失函数、根据视频特征与文本特征间的相似度对视频‑文本模型进行优化，并通过优化后的视频‑文本模型对待处理视频中的关键信息进行解析，得到待处理视频对应的自动驾驶场景。采用本方法能够得到更准确的自动驾驶场景。

技术关键词

文本令牌补丁字幕视频帧场景识别方法语义特征注意力机制交互组件图像计算机设备场景识别装置融合特征数据样本编码序列模型训练模块

系统为您推荐了相关专利信息

一种生成式对抗驱动的智能安全防御方法和系统

数据处理引擎 0day漏洞动态邻接矩阵语义动态知识图谱

基于叠加扩散模型的推理网络仿真流量生成方法和装置

流量生成方法样本视频推理网络文本

基于多源特征协同的视频换脸一致性增强方法

多源特征法线贴图换脸视频视频帧分割算法

基于大模型的放射治疗计划生成方法及系统

放射治疗计划特征提取模块生成方法放疗计划注意力

信息推荐方法、电子设备、计算机可读存储介质和产品

信息推荐方法话题主题消息机器学习模型

自动驾驶场景识别方法、装置、计算机设备、介质和产品

站点导航

APP 下载