一种基于单模型多任务推理的智慧座舱实现方法及系统

正文

推荐专利

申请号：CN202510700314

申请日期：2025-05-28

公开号：CN120510599A

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开了一种基于单模型多任务推理的智慧座舱实现方法及系统，属于汽车电子领域，包括对智慧座舱内原始图像数据预处理后，将共享深度特征输入检测头和第一分类头，检测头的输出采用检测后处理得到目标检测锚框及位置信息，第一分类头的输出采用分类后处理得到分心识别分类；对目标检测锚框及位置信息进行预处理后，将人体区域子图像输入安全带识别分类模型；将人脸区域子图像并行输入疲劳识别分类模型、人脸ID匹配模型、注视点估计模型、视线估计模型及头部姿态估计模型；采集连续视频流中的人脸图像序列和语音序列，分别输入唇语识别模型和语音识别模型，将识别结果输入大语言模型处理后生成交互指令，通过语音合成模块输出响应。

技术关键词

多任务座舱大语言模型人脸图像序列头部姿态估计语音识别模型原始图像数据唇语识别注视点特征提取网络手部关键点安全带视频流应急通风系统联合训练方法图像分类识别语音识别文本

系统为您推荐了相关专利信息

基于大语言模型且可解释的行人轨迹预测方法、装置

行人轨迹预测方法大语言模型深度学习模型模板自然语言

具身模型表示方法及相关设备

节点计算机程序产品计算机设备格式可读存储介质

一种基于FPGA芯片的画质增强方法及装置

FPGA芯片像素点通道图像直方图

一种基于知识图谱大模型的视频描述方法

大语言模型实体生成知识图谱关系构建知识图谱

一种基于大语言模型的产业创新知识图谱动态构建方法

动态构建方法大语言模型三元组标记机制两阶段提交协议

一种基于单模型多任务推理的智慧座舱实现方法及系统

站点导航

APP 下载